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توضيحات مفصلة لكتاب معين» ولا يشرح كل مميزات برنامج ستاتا.‎ elhel 
فهذا الكتاب يوضح كيف يمكن استخدام برنامج ستاتا لإنجاز ..جموعة كبيرة‎ 
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فصول هذا الكتاب تغطي موضوعات عامة بدلا من التركير على أوامر‎ 
مختلفا عن أدلة استخدام برنامج ستاتا.‎ USE GUS ستاتا معينةء وهذا يعطي‎ 
فمثلاً فصل إدارة البيانات يغطي العديد من الطرق المختلفة لإنشاء أواستيراد‎ 
أودمج أو إعادة ترتيب ملفات البيانات. والفصول الخاصة بالرس ومات‎ 
البيانيةء والإحصائيات الملخصةء والجداول» وتحليل التباين» ونماذج المقارنة‎ 
eiat oa :القن فين ةا‎ dosis obi uai الأخروئ» لها‎ 
Aglaia! المختلفة. وهناك فصل جديد يعطي مقدمة عن بيانات الدراسات‎ 
والذي تم وضعه ضمن الفصول الأولى من هذا الكتاب» حيث يعطي خلفية‎ 
مع أمثلة عن ذلك في الأماكن المناسبة والفصول اللاحقة.‎ 
Jaca ides o فصول‎ Anas JY العامة‎ ile sca gall 
الخطي) تتناسب مع مادة الإحصاء التطبيقي للدراسات الجامعية:؛ أو‎ 
المستويات الأولى من الدراسات الجامعية» ولكن تم إضافة عمق إضافي‎ 
أن‎ blah 3 sud dose خا غاد ة دو اجا الارن مكل‎ Dind ae! 
الرسومات البيانية لغرض النشر العلميء أو جودة الأشكال البيانيةء أو العمل‎ 
'8' مع أوزان الدراسات الاستقصائية» وحل مشاكل الانحدار. أما الفصل‎ . 
(طرق انحدار متقدمة) والفصول اللاحقة له»ء فقذ قمنا بالانتقال إلى‎ 
موضوعات متقدمة» أو ما يُسمى البحث الواقعي» حيث يمكن للقارئ أن يجد‎ 
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معلومات أساسية وشروحات عن Alla‏ تمهيد لوس» أو الانحدار الموثوق» أو 
الانحدار الربيعي» أو الانحدار غير الخطيء أو الانحدار اللوغاريتميء أو 
الانحدار اللوغاريتمي المرتب» أو الانحدار اللوغاريتمي متعدد الحدودء أو 
انحدار بواسون. وتم تطبيق طرق جديدة لصياغة المعادلة الهيكلية:؛ أو 
الحساب المتعدد للقيم المفقودة» ونماذج حساب الأحداثء وزمن البقاء. كما تم 
أيضاً صياغة واستخدام المتغيرات المركبة من التحليل العاملي: أو المكونات 
الرئيسة» حيث تم تقسيم المشاهدات إلى أنواع تجريبيةء أوعناقيدء أو تحليل 
سلاسل زمنية متعددة أو بسيطة لتناسب نماذج التأثيرات المختلطة أو متعددة 
المستويات. كما قامت شركة ستاتا بالعمل بجد في السنوات الأخيرة لتطور 
مكانتها الفنية والتقنية» ويظهر هذا المجهود بوضوح في تعدد أنواع أوامر 
النماذج الإحصائية التي يستخدمها البرنامج الآن. 

كما أن الكتاب يلقي نظرة على البرمجة في ستاتا. حيث يجد العديد من 
القرّاء بأن برنامج ستاتا يقوم JS‏ شيء يحتاجونه؛ ولذلك فليس هناك داع 
لكتابة البرامج الأصليةء بالنسبة للبعضء فإن البرمجة في ستاتا تعتبر إحدى 
الميزات الجذابة التي أدت إلى التطور السريع لهذا البرنامج. 

أما الفصل (14) فيفتح الباب للمستخدمين الجدد لاكتشاف البرمجة في 
ستاتاء وكيفية استخدام هذه البرمجة لأغراض مهام الإدارة المتقدمة للبيانات 
أو غيرهاء حيث يمكن للمستخدمين إنشاء قدرات إحصائية جديدة لتجارب 
مونت كارلو أو لغرض التدريس. 

وعموماًء هناك إصدارات متشابهة 'بتنسيقات مختلفة" لبرنامج ستاتاء مع 
أنظمة تشغيل ويندوز وماك ويونيكس. وفي كل أنظمة التشغيل celica‏ فإن 
برنامج ستاتا يقوم باستخدام نفس الأوامرء ويقوم بإنتاج نفس المخرجات» كما 
أن البيانات» والأشكال البيانية» والبرامج التي يتم إنشاؤها باستخدام ستاتا مع 
نظام تشذغيل معين يمكن استخدامها مع نظام تشغيل آخر. التنسيقات المختلفة 
sd‏ دامج Ga‏ - التي تظهر باختلاف نظام التشغيل - عبارة عن اختلاف 
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بسيط في تفاصيل الشاشة» ail silly‏ والتعامل مع الملفات» حيث يتبع برنامج 
ستاتا ما هو متعارف عليه في كل نظام التشغيل؛ مشل تحديد المجلد 
\directory\filename‏ في ظل تشغيل ويندوزء وعلى العكس من ذلك فإن 
المجلد في ظل نظام يونيكس يتم تحديده Yag t/directory/filename‏ من 
استخدام عرض لأنظمة التشغيل الثلاثةء فقد قمت باس تخدام نظام تشغيل 
ويندوز. وبالنسبة لمستخدمي أنظمة التشغيل الأخرى» فسوف يحتاجون للقيام 
I EE EE‏ نة )15 V gat‏ )20 

المؤلف 
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ملاحظات المؤلف على الطبعة dang Val]‏ 





بدأت في استخدام برنامج ستاتا سنة 1985« وهي أول سنة يتم فيها 
إطلاق هذا البرنامج. ومبدئيا فإن برنامج ستاتا كان يعمل على نظام تشغيل 
MS-DOS‏ فقطء ولكن الاتجاه نحو استخدام إصدار مع أجهزة الكمبيوتر 
الشخصيء جعل البرنامج يبدو ASÍ‏ حداثة من منافسيه الذين ظهروا قبل ثورة 
الكمبيوتر. حيث كانت هناك كروت مثقبة كبيرة مع 80 er‏ 
الفورتران. وعلى خلاف الاتجاه العام في البرامج الإحصائية التي تعتبر 
مستخدم عبارة عن حزمة من الكروت» فإن برنامج ستاتا نظر إلى "be‏ 
مع المستخدم كنوع من المحادثةء فطبيعة تفاعله وتكامله مع العمليات 
الإحصائية لإدارة البيانات» والأشكال البيانية تدعم التدفق الطبيعي للتفكير 
التحليلي بعدة طرقء لم تستطع البرامج الأخرى القيام بها. فالأمر «graph‏ 
والأمر «predict.‏ أصبحا من الأوامر المفضلة لدى الكثيرء لقد أعجبني يرا 
cie‏ ان گنها تات معا وبدأت كتابة أول کات ن سا توان 
"الإحصاء مع ستاتا" والذي نشر سنة 1989 لإصدار ستاتا 2. والذكرى 
العشرون لبرنامج ستاتا في سنة 2005 كانت متميزة بنشر إصدار خاص من 
مجلة ستاتا Stata Journal‏ يحتوي على مجموعة مقالات تاريخيةء ومقابلات» 
وملخص تاريخي عن GUS‏ "الإحصاء مع ستاتا". 

ستاتا تغير بقدر كبير Ma das‏ صدور الطبعة الأول للكتاب؛ حيث 
لخت أن Giu‏ ليم بر اما للقيام بكل شيء» ولكن الأشياء التي يقوم بها 
يتم إنجازها بشكل رائع. التوسع الكبير في قدرات ستاتا كان مذهلاء وهذا 
واضح las‏ في التكائر» ولاحقأ في التبرير المنطقي للإجراءات صياغة 
النماذج. فأسلوب بناء وليام جولد لبرنامج ستاتاء والذي يشمل أدوات ستاتا 
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البرمجية وصيغ أوامره نصيّة تم تقديمها بشكل جيدء وتم دمج طرق إحصائية 

جديدة خلال تطويرهاء وهناك تشكيلة كبيرة من الرسومات البيانية في الفصل 
(3) وفي الفصل (8) حيث تمت مناقشة عدد كبير من أوامر صياغة النماذج. 

وفي الفصول اللاحقة تم مناقشة السلاسل الزمنية الجديدة. وقدرات 
النماذج المختلطة؛ ونماذج التعويض المتعددة. وهذا النقاش يوضح مدى 
التطور الكبير في برنامج ستاتا خلال السنوات الماضية؛ كما توجد هناك 
مساحات للتقنيات الجديدة مثل تلك المتعلقة بالبيانات الطولية (xt)‏ والبيانات 
الاستقصائية «(svy)‏ وبيانات السلاسل الزمنية «(ts)‏ وزمن البقاء (st)‏ 
والإسناد المتعدد .(mi)‏ هذه المساحات تفتح alle‏ الاحتمالات» كما تفعل 
الأوامر البرمجية للنماذج الخطية العامة (gim)‏ أو الإجراءات العامة لتقدير 
الأرجحية العظمى؛ التطور الرئيس الآخر يتضمن تطور قدرات برمجة 
المصفوفات» والزيادة بإضافة مميزات جديدة في إدارة البيانات والأدوات 
التحليلية متعددة الأغراض» مثل الرسومات البيانية الهامشية أو صياغة 
المعادلة الهيكلية» وإدارة البيانات تم تطويرها من موضوع بسيط في أول 
طبعة لكتاب الإحصاء مع ستاتا إلى فصل كامل.في الطبعة الثامنة. 

القائمة الشاملة لبرنامج ستاتاء ونظام مربعات الحوارء تعتبر طريقة 
بديلة للأوامر التي تت طباعتها. حيث يمكن الاختيار والنقر على أي أمرء 
القوائم المنسدلة واختيارات ومربعات الحوار يمكن تعلمها بسهولة من خلال 
الاكتشاف Yay‏ من القراءة. وعموماً فإن كتاب "الإحصاء مع ستاتا" يعطي 
تلميحات عامة عن القوائم في بداية كل فصل. في أغلب أجزاء هذا الكتاب» 
قمنا باستخدام الأوامرء وذلك لتوضيح ما يمكن لبرنامج ستاتا عمله» ونظائر 
الأوامر الموجودة بالقوائم يمكن التعرف عليها بسهولة» وعلى العكس من 
calls‏ فإذا بدأت العمل من خلال القوائم» فإن ستاتا يوفر تدريبا غير رسمي 
من خلال عرض الأمر ذات العلاقة في نافذة النتائج» حيث إن القوائم 
ومربعات الحوار تعمل على ترجمة النقر إلى أوامر ستاتاء والتي يتم تنفيذها 
ببرنامج ستاتا. س. 
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الرسومات البيانية التحليلية تعتبر إحدى نقاط القوة المتميزة ببرنامج 
ستاتاء كما هو واضح في كل فصل من هذا الكتاب. فالعديد من الأمثلة ليست 
صورا بدائية تقوم بتوضيح تقنية معينة» ولكنها تقوم بتجسيد بعض التحسينات 
لغرض النشر أو تطوير جودة العرض. قد يقوم القارئ بتصفح هذه الأشكال 
البيانية للتعرف على بعض الأفكار حول الأشكال البيانية المحتملة» والتى قد 
l EE datio 4M PAN‏ 

الإخضاء مع Glas‏ (الإضداز. 12( cilia;‏ جوهريا pag Able Ge‏ 
كتاب (الإصدار 10( حيث تم إعادة تنظيم الفصول» وتم تضمين فصل جديد 
وهو عبارة عن مقدمة GUL‏ الدراسات الاستقصائيةء والذي يأتي في بدايات 
الكتاب؛ كما تم تناول مواضيع الانحدار في أربعة فصول في كتاب الإصدار 
0 تم دمجها وتنظيمها بطريقة أكثر منطقية في فصلين» الأول: عن الانحدار 
الخطيء Ul‏ الثاني: عن طرق الانحدار المتقدمة. فصل الانحدار المتقدم 
يحتوي على أجزاء جديدة عن الإسناد المتعدد للقيم المفقودةء وعن نماذج 
المعادلة الهيكلية- Led (SEM)‏ فصل تحليل المكونات الأساسية» والتحليل 
العاملي؛ والتحليل العنقودي» فيتضمن Laj‏ جزءين جديدين يعرضان استخدام 
العلامات العامليّة في الانحدارء واستخدام قياس النماذج في «SEM‏ الجزء 
الجديد في فصل صياغة نماذج التأثيرات Absa‏ وذات المستويات 
المتعددة» يعرض تجربة القياس المتكررء Ld‏ الفصل الأخيرء فهو عن 
البرمجة» وتم تبسيطه وتركيزه حول مثال رئيس (يقوم برسم أشكال بيانية 
للمسح المتعدد)ء وهو مفيد لبعض القرّاء. 

A fu! أهداف إصدار ومراجعة كتاب الإصدار 12ء هو تطوير‎ asl 
فبعضها كان من بحوثي من فترة التسعينيات» ولكن مازالت مفيدةء فتحليل‎ 
مكوك الفضاء تشالينجر - والذي تم استخدامه في إصدار سنة 1989 من هذا‎ 
الكتاب والإصدارات اللاحقة - مازال مفيدًا لعرض الأفكار الأساسية في‎ 
بداية فصل الانحدار اللوغاريتمي» هذا الفصل ينتهي مع التحليل اللوغاريتمي‎ 
متعدد الحدود للردود على استطلاع سنة 2011 الذي يقوم بالاستفسار عن‎ 
ماذا يعرف الناس؟ ومادا يعتقدون بخصوص التغير المناخيء الاستطلاع‎ 
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الخاص بالتغير المناحي هو واحد من ثلاثة بيانات استطلاعية جديدة لسنة 
0 وسنة 2011. وهذه البيانات تم استخدامها في عدة أمثلة في فصول 
مختلفة» أحد هذه الفصول (تحليل المكونات الرئيسة والتحليل العاملي) يبدأ مع 
بيانات مبسطة خاصة بالكواكب» ولكن ينتهي بجزء جديد يدمج التحليل 
العاملي مع الانحدارء وقياسات مناظرة» ونماذج المعادلة الهيكلية مستخدما 
بيانات استطلاع عن البيئة الساحلية لسنة 2011؛ الأمثلة الأخرى تتضمن 
سلاسل زمنية للمتغيرات التنبؤية للمناخ نفسه. وأحد البيانات المتميزة تتعلق 
ب 42 قرية في آلاسكاء وتم الحصول على هذه البيانات من دراسة في سنة 
2011( وهي توضح كيف أن صياغة نماذج التأثيرات المختلطة يمكن أن 
تدمج العلوم التطبيقية مع بيانات العلوم الاجتماعية. ونماذج ARMAX‏ تختتم 
فصل السلاسل الزمنية والتي تم تطويرها ببيانات دراسة أجريت في سنة 
1 اختبرت "الإشارة الحقيقية" للاحتباس الحراري» وحيثما أمكن فقد 
حاولت أن تكون الأمثلة تطرح أسئلة بحثية حول قضايا عامة بدلاً من عرض 
أرقام لتوضح طريقة التحليل. كما أن العديد من بيانات الأمثظة تتضمن 
متغيرات أخرى تتجاوز ما تم مناقشته في هذا الكتاب. وهي تمكل دعوة 
Gl eT a‏ يقوموا بتحليلات أكثر خاصة بهم. 

LS,‏ لاحظنا في Jail‏ )1( فإن أدوات المساعدة والبحث في ستاتا تم 
تطويرها لتحافظ على السرعة مع البرنامج» وبالإضافة إلى وثائق ستاتا 
المتوافرة من خلال ملفات المساعدة» توجد هناك صفحة إنترنت خاصة 
ببرنامج ستاتاء وإمكانية البحث في الوثائق الموجودة بتلك الصفحة. كما يوجد 
هناك منتدى المستخدمين» وتوجد هناك برامج تدريبية في «NetCourses‏ 
ومجلة Stata Journal GG‏ وهناك أكثر من 9,000 صفحة من الوثائق. 
فكتاب "الإحصاء مع ستاتا" يعتبر بوابة عبور لبرنامج ستاتا. فكل هذه 
المصادر التي تم ذكرها سوف تكون مصادر لمساعدتك. 


مقدمة المترجم 





الحمد لله» والصلاة والسلام على رسول الله» وعلى آله وصحبه أجمعين. 
الحمد لله الذي وفقني لإتمام ترجمة هذا الكتاب» alld‏ الحمد والمنة على ذلك. 
هذا الكتاب هو محاولة لسد النقص الملحوظ في المراجع العربية التي تتناول 
بالشرح والتحليل كيفية استخدام برنامج ستاتا في التحليل الإحصائي. فهذا 
البرنامج له قدرات هائلة تخفى عن الكثيرين. وهذا الكتاب هو بمثابة دليل 
استخدام مبدئي لبرنامج ستاتا. فمن الصعب الإلمام بكافة قدرات هذا البرنامج 
وإمكاناته الضخمة في كتاب واحد. 

قبل الولوج إلى دفات كتاب "الإحصاء مع برئامج ستاتا" أنصح القارئ 
الكريم Gh‏ يتجه مباشرة للموضوعات ذات الصلة بدراسته واهتماماته» مع 
ملاحظة ضرورة الاطلاع على الفصول الثلاثة الأولى؛ Cus‏ تناول Jail‏ 
الأول: لمحة سريعة عن الكتاب» وما تعنيه تنسيقات الخطوط المستخدمة.٠‏ أما 
الفصل الثاني: فقد تطرق إلى كيفية إدخال البيانات لبرنامج ستاتاء وكيفية 
استيرادها من البرامج الأخرىء وإدخالها لبرنامج ستاتاء وكذلك نوه إلى أنواع 
المتغيرات» وأنواع العينات. أما الفصل الثالث: فهو بمثابة معرّض لأشكال 
الرسومات البيانيةء حيث شرح بنوع من التفصيل أوامر إنشاء الرسومات 
البيانية وأنواعها وطرق تحريرها وتعديلهاء كما تناول كذلك كيفية دمج JS)‏ 
من شكل بياني في شكل واحد. 

بقية فصول الكتاب - وهي عشرة فصول - فقد تناوالت موضوعات 
تحليلية مستقلة بذاتهاء فيمكن للقارئ الانتقال إلى الفصل الذي يتعلق بمجال 
بحثه» وفي حالة الحاجة إلى أي معلومة من الفصول السابقةء فقد تم الإشارة 
إلى الجزء الذي يجب على القارئ الانتقال إليه مباشرة في الفصول السابقة؛ 
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Li‏ الفصل الأخير - وهو الفصل الرابع عشر - فيُعتبر مقدمة عن كيفية 
إنشاء أوامر ببرنامج ستاتا. وهذه الميزة لا توجد في العديد من برامج الحزم 
الإحصائية المعروفة» حيث يمكن للقارئ تصميم أوامر لأساليب إحصائية 
جديدة - وهذا الأمر متقدم جدا - أو إدارة قاعدة بيانات معينة» وجعل هذه 
الأوامر متاحة لجميع المستخدمين في العالم ليقوموا بتحميلها واستخدامها. 

ختاماء لا يفوتني أن أتقدم بخالص شكري وامتناني لكن من ساهم في 
إخراج هذا الكتاب إلى حيّز الوجودء وأخص بالذكر والدي فالكلمات تعجز 
عن التعبير عن مدى امتناني لهماء كما أتقدم بشكري الجزيل لإخوتي 
وأصدقائي الأعزاء على تشجيعهم ودعمهم المستمرعلى إتمام هذا العمل» كما 
أتقدم بشكري وامتناني لأساتذتي الأفاضل» وأخص بالذكر أستاذي الفاضل 
وصديقي العزيز الدكتور ania‏ أحمد بالخيرء فهو مثال للعطاء وقذوة في 
البذل بإخلاصء لقد كان لدعمه وتشجيعه لي خلال فترة دراستي بمرحلتي 
الماجستير والدكتوراه الأثر الكبير في تطوير مهاراتي. كما أتقدم بالشكر 
لجميع العاملين بدار المريخ على مجهوداتهم وتعاونهم الكبير في clo‏ هذا 
الكتاب بالصورة المطلوبة. فجزى الله الجميع عني خيرأء وأدعو لله أن يجعل 
هذا الكتاب ais Lale‏ به. 


د. رمضان مفتاح الفيتوري 
كلية الاقتصاد — جامعة عمر المختار — ل 


تنويه: 





لتطبيق الأمثلة الواردة في هذا الكتاب» فأنت تحتاج إلى تحميل 
ملفات البيانات الخاصة ARYL‏ ويمكنك الحصول عليها من الرابط 
التالي: http://www.stata.com/bookstore/swsdl.html‏ 


المترجم 





Sal) ait) 
سنانا ومصادر البيانات‎ 


Stata and Stata Resources 





ستاتا عبارة عن برنامج إحصائي متكامل لأجهزة الكمبيوتر التي تعمل 
باستخدام نظم التشغيل Windows‏ أو Cus Linux 3 Mac‏ إنه يمتاز بالسهولة 
والسرعة في الاستخدام» وهو عبارة عن مكتبة لها القدرة على إدارة البيانات 
واستخدام البرامج التحليلية المعدة مسبقاء والقدرة على البرمجة التي تتيح 
للمستخدمين اختراع وإضافة قدرات أكثر حسب الحاجة. أغلب العمليات 
الإحصائية يمكن إنجازها باستخدام القوائم المنسدلة أو بطباعة الأوامر 
مباشرة. كما أن القوائم تساعد المستخدمين الجدد لبرنامج ستاتا على تعلم 
البرنامج» كما Gol‏ تساعد على تطبيق الإجراءات غير المعتادة؛ إن اس تخدام 
أوامر ستاتا وكتابتها باستمرارتساعد المستخدمين ذوي الخبرة على القيام 
بأعمالهم بكفاءة أكثرء كما يجعل تطوير البرامج للاستخدامات المعقدة عملية 
سهلة. أما استخدام ail all‏ والأوامر معاء يمكن أن cu‏ حسب الحاجة أثناء 
استخدام ستاتا. كما أن المساعدة المكثفة الموجودة ببرنامج ستاتاء تمكنك من 
البحث ومعرفة الميزات التي تجعل من السهل العثور على تركيبة الأمر 
والمعلومات في وقت قصير جدا. هذا الكتاب تم إعداده كتكملة لميزات 
المساعدة الموجودة ببرنامج ستاتا. 

بعد مقدمة مبسطةء سوف نبدأ بأمثلة عن ستاتا لإعطائك لمحة عن 
تسلسل عملية تحليل البيانات» وكيفية استخدام النتائج الإحصائية. والفصول 
اللاحقة تشرح ذلك JEn‏ أكثر تفصيلا. uis‏ بدون شرح» يمكنك أن ترى 
كيف أن yl sl‏ ستاتا واضحة use filename Seu‏ هو yd‏ يستخدم 
لفتح ملف بيانات اسمه Lil «filename‏ الأمر summarize‏ فيمكنك عن طريقه 
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الحصول على ملخص correlate «Las!‏ للحصول على مصفوفة 
الارتباط وهكذاء هذه النتائج أيضا يمكن الحصول عليها باختيارها من قوائم 
Data‏ أو Statistics‏ . 
مستخدمو ستاتا لديهم عدد كبير من المصادر التي تساعدهم على FE,‏ 
ستاتا وحل المشاكل مهما كانت صعبة. هذه المصادر تأتي ليس فقط من 
شركة Gau‏ تفسهاء يل Uca]‏ هق عدد من bg sy bh i Carded‏ 
تعرض أجزاء هذا الفصل المصادر الرئيسة للحصول على المساعدة وطباعة 
دليل الاستخدامء وأين يمكنك إرسال بريد إلكتروني للحصول على المساعدة 
التقنية من صفحة ستاتا www.stata.com‏ والتي توفر الكثير من الخدمات بما 
فيها التحديثات» وجزء عن الأسئلة المتكررةء وقائمة ستاتا على الإنترنت» 
وماخلة asc.‏ 
ملا حظطان حول Glaus‏ الطباعة : A Typographical Note‏ 
هذا الكتاب لب يستخدم مجمو ác‏ من xil‏ لتنسيقات التي توضح كيفية | ستخدام 
الكلمات: 
- الأوامر التي تطبع بواسطة | لمستخدم تظهر là‏ أسود عريضء وعند 
كتابة سطر أمر بالكاملء فإنه يبدأ بمسافة» كما يظهر في نتائج ستاتا أو 
ملف سجل المخرجات. 
.Correlate extent area volume temp‏ 
- أسماء المتغيرات والملفات الموجودة في أي jd‏ تظهر بخط مائل للتأكيد 
على أنها ليست جزءًا من الأمر ولكنها تابعة له. 
- أسماء المتغيرات والملفات تظهر بخط مائل ضمن الأمر نفسه حتى تساعد 
على التفرقة بينها وبين الكلمات العادية. 
- العناصر التي تعبّر عن قوائم من شريط مهام ستاتا تظهر بخط من نوع 
Arial‏ يليها الخيارات ويفصل بينها علامة ">" فعلى سبيل المثال» يمكننا 
فتح ملف بيانات باستخدام القائمة File > Open‏ وبعد ذلك يتم تحديد 
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الملف المطلوب والنقر عليه؛ وهناك العديد من المهام التي يمكن إنجازها 
باستخدام القوائم الموجودة في أعلى نافذة ستاتا. 
File Edit Data Graphics Statistics User Window Help‏ 
أو استخدام صف الأيقونات الموجودة أسفل هذه d Wud call gall‏ 
Las!‏ القائمة File > Open‏ يُعادل النقر على الأيقونة الموجودة أقصى 
اليسارء وهي تشبه المجلد المفتوح» نفس الشيء يمكن القيام به بطباعة أمر 
على الشكل التالي: 
.use filename‏ 
وهكذا يمكننا عرض ملخص إحصائي للمتغير extent‏ كما يلي : 


.Summarize extent 


Variable Obs Mean Std. Dev. Min Max 


extent 33 6.51697 . 9691796 4.3 7.88 


Aaii‏ وستاتا له القترة على عرض أنواع متعددة من الخطوط على الشاشة» 
ولكنه لا يستخدم الخط المائل في أوامر ستاتاء فعندما يقوم برنامج ستاتا 
باستخدام ملفات معينة تم استيرادها من برنامج نصي آخر أو جدول نتائج تم 
نسخه ولصقه»ء يمكنك تغيير تنسيق هذه الملفات إلى نوع الخط Courier‏ وحجم 
0 أو أصغرء وبذلك فإن أعمدة البيانات سوف تظهر بصورة منظمة 
وواضحة. 

ستاتا برنامج حساس لحالة أحرف المتغيرات» حيث إن الحرف الصغير 
يختلف عن الحرف الكبيرء lily‏ فإن summarize‏ يعتبز Vd‏ ولكن 
SUMMARIZE 5 Summarize‏ لا تعتبر أو امرء كذلك فإن extent s Extent‏ سوف 
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مثال على استخحدام An Example Stata Session : úw‏ 


كنظرة عامة على كيفية استخدام ستاتاء هذا الجزء سوف يشرح استخدام 
وتحليل بيانات تم إعدادها مسبقا بملف اسمه “مبه.ومنع4» وهي عبارة عن 
سلسلة زمنية صغيرة تم جمعها بالأقمار الصناعية في الفققرة )1979 إلى 
2011( فهي مشاهدات عن الجليد في المحيط المتجمد الشمالي خلال شهر 
Aule SEE OH je‏ البيانات تم الحصول عليها من ثلاثة 
مصادر مختلفة (انظر المرفق الخاص بمصادر البيانات في نهاية هذا 
الكتاب). المتغير الأول extent‏ وهو قياس يعتمد على صور القمر الصناعي 
للمنطقة البحرية في نصف الكرة الشمالي والتي تحتوي على نسبة 9615 
على الأقل من الجليد كل شهر سبتمبر Area‏ وهي أرقام al‏ من extent‏ تمثل 
المنطقة المتجمدة نفسهاء متغير آخر وهو temp‏ يوضمح متوسط درجة 
الحرارة السنوية لهواء سطح البحر بالمنطقة التي تقع أعلى من 64° شمال 
خط cel ay!‏ ودرجات الحرارة تم التعبير عنها بدرجات الحرارة BILAN‏ 
وهي تلك المكتوبة بطريقة مختلفة» بحيث إنها توضح الانحراف عن متوسط 
درجة الحرارة المئوية خلال الفترة 1951 مسد حيث لدينا 33 مشاهدة 
(سنوات) و8 متغيرات. 
نحن ربما نحتاج في نهاية الأمر إلى تسجيل خطوات هذه العملية؛ 
وأفضل طريقة للقيام بذلك تتم بواسطة فتح ملف تسجيل في بداية عملناء حيث 
إن ملف التسجيل يحتوي على «pal gl‏ وجداول النتائج» ولكن لا يحتوي على 
الرسومات البيانية. وللبدء بفتح ملف تسجيل قم بختيار File > Log > Begin‏ 
من شريط القوائم» ثم قم باختيار اسم الملف والمجلد الذي تريد أن تحفظ فيه 
ملف تسجيل النتائج» أو يمكنك طباعة أمر مباشر كما يلي : 
-log using Monday1‏ 
هناك عدة طرق للقيام بالأشياء الأكثر استخداما في ستاتاء 5 JS‏ طريقة 
لها مزاياها وتناسب أوضاعاً أو أذواقا مختلفة للمستخدمين. 


* البيانات الخاصة بهذا الكتاب يمكن الحصول عليها من موقع www.stata.com‏ 
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ملفات التسجيل يمكن إنشاؤها في ستاتا بامتداد خاص smel)‏ أو 
كملفات نصية عادية أو بتنسيق e(.log) ASCH‏ امتداد smel‏ (لغة ستاتا في 
الاستعادة والتحكم) سوف تكون مناسبة للمعاينة والطباعة باستخدام برنامج 
ستاتاء كما يمكن أيضًا أن يحتوي الملف على اختصار يساعد في فهم الأوامر 
ورسائل الخطأء والتي لا يمكن أن تحتويها ملفات التسجيل النصيةء ولكن 
الملفات النصية لها نفس الاستخدامات إذا كنت تريد التخطيط لاحقا لإدراج أو 
تحرير نتائج في برنامج معالج النصوص f Word‏ بعد اختيار نوع ملف 
التسجيل تحتاج إلى حفظ الملف بواسطة hual‏ على Save‏ في هذا 
التمرين» سوف نقوم باستخدام ملف تسجيل بنوع smel‏ باسح -Mondayl.smcl‏ 
سوف يتم تحليل بيانات الملف المسمى م,9.4ه//ه+. ولفتح الملف 
واستخراج بياناته» هناك عدة خيارات» من قائمة المهام اختر منها » File‏ 
Open >Arctic9.dta‏ 
أو اضغط على أيقونة فتح 3 ثم Arctic9.dta‏ 
أو قم بطباعة الأمر: 
.use Arctic9.dta‏ 
الإعدادات الافتراضية في نظام التشغيل ويندوز ead‏ ستاتا يبحث عن 
ملفات البيانات في مجلد المستندات الخاصة بالمستخدم» وإذا كنا نريد ملفا في 
مجلد مختلفء فإنه يجب علينا تحديد موقع الملف عند استخدام use ysl‏ 
.use C:\books\sws_12\data\Arctic9‏ 
أو يمكنك تغيير المجلد الافتراضي وذلك باستخدام الأمر cd‏ 
ecd C:\books\sws_12\data\‏ 
.use Arctic9‏ 
أو قم باختيار ... File >Change Working Directory‏ من ‘ail sa)‏ 
وفي الغالب فإن أسهل طريقة لفتح ملف البيانات هي File » Open‏ ثم تحديد 
المجلد بالطريقة المعتادة. 
لمشاهدة وصف مختصر للبيانات قم بطباعة الأمر: 


.describe 
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Contains data from C:\data\Arctic9.dta 








obs: 33 Arctic September mean sea ice 1979-2011 
vars: 8 2 Jul 2012 06:11 
Size: 891 
storage display value 
variable name type format label variable label 
year int sty Year 
month byte 98 . 09 Month 
extent float 39.09 Sea ice extent, million km^2 
area float %9.0g Sea ice area, million km^2 
volume float %B.0g Sea ice volume, 1000 km^3 
volumehi float %9.0g Volume * 1.35 (uncertainty) 
volumelo float 59.09 Volume - 1.35 (uncertainty) 
tempN float %9.0g Annual air temp anomaly 64N-90N C 





Sorted by: year 
٠ 


» 


العديد من أوامر ستاتا يمكن اختصارها باستخدام حروفها الأولى» فمثلا 
يمكننا اختصار describe‏ لتكون Lit‏ الحرف «d‏ باستخدام ail sill‏ يمكن 
الحصول على نفس الجدول بختيار الأمر: 

Data» Describe Data > Describe data in memory > (OK). 

البيانات الموجودة لدينا تحتوي على 33 مشاهدة و8 متغيرات. لذا يمكننا 
وضع قائمة US‏ محتوياتها بطباعة الأمر List‏ (أو cios‏ أو اختيار 
«(Data>Describe Data > List data > (OK)‏ للاختصار فقط سوف 
نعرض أول عشر سنوات بطباعة الأمر: 

.list in 1/10 


year monch extent area volume volumehi volumelo tempN 


.9095 18.2595 15.5595 
.3194 17.66937 14.96937 
.8131 14.16307 11.46307 
.5099 14.85987 12.15987 
.2013 16.5513 13.8513 


سم زرح نما una»‏ 


6 14.6336 15.98357 13.28357 
7 14.5836 15.93363 13.23363 
8. E ` 16.0803 17.43027 14.73027 
9 15/3609 16.7109 14.0109 
0 14.988 16.338 13.638 
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التحليل يمكن أن يبدأ بجدول به المتوسط الحسابي والانحراف المعياري؛ 
وأعلى dad‏ وأصغر Aad‏ بطباعة الأمر summarize‏ أو «su‏ أو قم 
باختيار ذلك من القائمة 
Statistics>Summaries, tables, and tests > Summary and‏ 

descriptive statistics > Summary statistics (OK) 
. summarize 





variable Obs Mean Std. Dev. Min Max 
year 33 1995 9.66954 1979 2011 
month 33 9 0 9 9 
extent 33 6.51697 .9691796 4.3 7.88 
area 33 4.850303 .8468452 3.09 6.02 
volume 33 12.04664 3.346079 4.210367 16.9095 
volumehi 33 13.39664 3.346079 5.560367 18.2595 
volumelo 33 10.69664 3.346079 2.860367 15.5595 
tempN 33 .790303 .7157928 -.57 2.22 


لطباعة نتائج هذا التحليل اضغط على نافذة النتائج ثم اضغط ت أو من 
القوائم اختر File>Print > Results‏ 


لنسخ الجداول والأوامر أو أي Gla gles‏ أخرى من نافذة النتائج في أي 
معالج نصوصء قم باستخدام الفارة لتحديد النتائج المراد نسخها ثم اضغط 
الزر الأيمن للفارة واختر Copy Text‏ من القائمة المختصرة»ء ثم بعد ذلك 
انتقل إلى معالج النصوصء واختر المكان المراد إدراج البيانات به.ء ثم 
اضغط على الزر الأيمن للفارة واختر Paste‏ أو اضغط على أيقونة Gat‏ 
في برنامج معالج النصوص (Microsoft Word‏ الخطوة الأخيرة في أغلب 
الحالات هي تعديل النص الذي تم لصقه ليكون بحجم الخط المطلوب. 

مستوى جليد البحر 4 وحجمة volume‏ في شمال الكرة الأرضية area‏ 
يفترض أن يرتبط بدرجة حرارة الهواء السنوية temp‏ ليس فقط GY‏ الهواء 
الساخن يساعد في الذوبان» ولكن Leal‏ لأن درجة الهوإء فوق سطح الجليد 
سوف تكون أكثر Lida‏ من الجليد نفسه؛ يمكننا مشاهدة الارتباط بين هذه 
المتغيرات بطباعة الأمر correlate‏ يليه قائمة بالمتغيرات 


.Correlate extent area volume tempN 
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(obs=33) 


extent area volume tempN 





extent . 1.0000 
area 0.9826 1.0000 
volume 0.9308 0.9450 1.0000 
tempN -0.8045 -0.8180 -0.8651 1.0000 


النتائج توضح أن هناك ارتباطاً إيجابيا قوياً بين مستوى جليد البحر 
extent‏ وحجمه volume‏ في شمال الكرة الأرضية area‏ وهو ما كان متوقعاء 
وهذه المتغيرات ترتبط بشكل سلبي مع درجة الحرارة cremp‏ وهذا يعني أن 
درجة حرارة الهواء تؤدي إلى نقص في الجليد والعكس صحيح. 

مصفوفة الارتباط code‏ يمكن الحصول عليها كذلك باستخدام ail gill‏ كما 
يلي: 


Statistics>Summaries, tables, and tests > Summary and 
descriptive statistics >Correlation and covariance 


ثم قم باختيار المتغيرات التي تريد قياس ارتباطها. 

بالرغم من أن استخدام القوائم سهل وواضح. فإنها أكثر تعقيداً من 
طباعة الأوامرء blig‏ على ذلك» فإننا سوف نركز بشكل أساسي على طباعة 
الأوامرء وفي نفس الوقت سوف نشير إلى القوائم بشكل عرضي. أما 
اكتشاف كيفية استخدام القوائم» وكيفية القيام باستخراج النتائج عن طريق هذه 
القوائم فسوف نتركه للقارئ. والسبب الآخر في استخدام طريقة طباعة 
الأوامرء هو أن دليل استخدام ستاتا يستخدم طريقة الأوامر للشرح 
والتوضيح. 

إذن فهناك ارتباط بين مستوى جليد البحر extent‏ وحجمه volume‏ في 
شمال الكرة الأرضية area‏ ودرجة الحرارة uempN‏ كيف تأثرت هذه 
المتغيرات خلال فترة من الزمن؟ الرسم البياني (1.1) والذي تم الححصول 
عليه بالأمر graph twoway connect.‏ يوضح مستوى الجليد خلال سنوات 
الدراسة crear‏ المتغير الذي يتم إدخاله أولاً في هذا الأمر هو مستوى جليد 
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البحر cextent‏ سوف يظهر على المحور العمودي أو محور y‏ بينما المتغير 
الذي يتم إدخاله أخيرا فسوف يظهر على المحور الأفقي year‏ أو محور x‏ 
ويمكننا أن نرى من الشكل أن هناك انخفاضا كبيرًا في المنحنى» حيث إن 
حجم الجليد خلال شهر سبتمبر انخفض بأكثر من الثلث خلال المدة. 


graph twoway connect extentyear 


ce 
Nn 
E 
x 
c 
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E 
go 
2 
x 
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1980 1990 2000 2010 
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(1.1) الشكل‎ 


لطباعة الرسم البياني» اذهب إلى نافذة الرسم البياني» واضغط على 

أيقونة الطباعة أو & اختر File > Print‏ ولنسخ الرسم البياني داخل معالج 

النتصوص اضغط زر الفارة الأيمن على الرسم البياني ثم اختر Copy‏ بعد ذلك 

انتقل إلى alles‏ النصوص وحدد المكان الذي تريد أن تقوم بإدراج الرسم به 
. واضغط أيقونة لصق أو اختر تحرير > لصقء أو تحرير > لصق خاص. 

لحفظ الرسم البياني للاستخدام مستقبلاً اضغط زر الفارة الأيمن واختر 

File > أو اضغط أيقونة لص حفظ في نافذة الرسم البياني» أو اختر‎ Save as 
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Save‏ ومن قائمة Save as type‏ هناك مجموعة تنسيقات مختلفة لنوع 

الملف» في نافذة الحفظ هناك sac‏ خيارات بامتدادات ihia‏ وهذه الخيارات 

تتضمن : 

Stata graph (*.gph)‏ وهذا النوع يحتوي على معلومات كافية ليتم 
تحرير الرسم باستخدام برنامج ستاتا. 

Asisgraph(.gph)‏ وهو نوع مضغوط من تنسيقات ستاتا. 

Windows Metafile (*.wmf) 

Enhanced Metafile (*.emf) 

Portable Network Graphics (*.png) 

TIFF (*.tif) 

PostScript (*.ps) 

Encapsulated PostScript with or without TIFF preview (*.eps) 

Portable Document File (*.pdf) 


أنظمة التشغيل الأخرى (Jia‏ ماك Mac‏ أو لينكس Linux‏ توفر de gama‏ 
مختلفة من الخيارات لحفظ الرسم البياني» بغض النظر عن أي تنسيق تريده 
لحفظ الملف. من الأفضل أن يتم حفظ نسخة من الرسم البياني بامتداد gph‏ 
حيث يمكن مع هذا الامتداد فتح الملف لاحقا باستخدام برنامج ستاتاء ودج 
الرسم وتغيير ألوانه وإعادة تتسيقه باستخدام الأمر graph use‏ أو graph‏ 
combine‏ أو تحرير الرسم البياني باستخدام Graph Editor‏ (الفصل الثالث من 
هذا الكتاب). 
خلال كل (Jal ja‏ التحليل في هذا الكتاب» ملف التسجيل Mondayl.smcl‏ 
سوف يقوم بحفظ النتائج» وأسهل طريقة لمعاينة ما تم حفظه في هذا cà lal‏ 
يتم بفتح الملف باستخدام نافذة المعاينة» ويكون ذلك باختيار: 
File>Log > View > OK‏ 
ويمكننا طباعة محتويات ملف C]‏ التسجيل بالضغط على B Ad‏ وهي 
في أعلى شريط المهام في نافذة المعاينةء وملفات التسجيل يتم إغلاقها تلقائيا 
عند إغلاق ستاتاء أو يتم ذلك قبل إغلاق ستاتا بالضغط على هذه الأيقونة 
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الموجودة فى أعلى شريط المهام في نافذة ستاتا واختر Close log file‏ أو 
يمكنك ijs‏ الأمر Log close‏ كما يمكن اختيار: 
File>Log > Close‏ 
عند إغلاق ملف التسجيل «Mondayl.smcl‏ يمكن إعادة فتحه ومشاهدة 
محتوياته من خلال File» Log > View‏ أو اضغط أيقونة إن بعد استخدام 
ستاتا؛ ولإنشاء ملف مخرجات يمكن فتحه باستخدام أي alles‏ نصوص أو 
ترجمته من ملف التسجيل الذي ينتهي بامتداد smel‏ (تنسيق ستاتا لملفات 
التسجيل) إلى log‏ (الصيغة العامة للملف النصي (ASCH‏ قم بطباعة الأمر 
التالى : 


.translate Mondayi.smcl Mondayl.log 
كما يمكنك‎ smel من‎ Yas Jog أو يمكنك البدء بإنشاء ملف تسجيل بامتداد‎ 
أيضًا البدء والتوقف مؤقتا في استعمال ملف التسجيل في أي لحظة باختيار:‎ 
File>Log > Suspend 
File>Log > Resume 
الموجودة في شريط مهام ستاتاء يمكنها أيضًا القيام‎ t]. وأيقونة التسجيل‎ 
بكل هذه المهام.‎ 
: Vus أطسنتدات واطلفات امساعده لبرنامخ‎ 
Stata's Documentation and Help Files 
دليل استخدام ستاتا 12 يتضمن 19 مجلدا: دليل صغير الحجم عن بدء‎ 
Jala g » Qus (مثلا: البدء باستخدام ستاتا مع‎ Getting Started استخدام ستاتا‎ 
الذي يتكون من أربعة مجلدات‎ User's Guide أكثر تركيزًا وهو دليل المستخدم‎ 
ويحتوي على شرح عن‎ «Base. Reference Manual شاملا‎ ls: ja شاملة تمثل‎ 
وبرمجة المصفوفات‎ å shll إدارة البيانات» والرسومات» والبيانات‎ 
والاستدلال المتعدد والبرمجة وصياغة نماذج المعادلات الهيكلية» وبيانات‎ 
الاستبيانات» وجداول تحليل التعداد السكاني « وتحليل السلاسل الزمنية. كما‎ 
يساعدك على تثبيت برنامج ستاتاء‎ Gering Started استخدام ستاتا‎ eas أن دليل‎ 
User's ولعن دليل المستخدم‎ «a وإدارة ويندوز» وإدخال البيانات» والطباعة..‎ 
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Guide‏ يحتوي على نقاش تفصيلي عن المواضيع العامة بما فيها مصادر 
البيانات» وحل المشاكل في ستاتاء ويجب ملاحظة أن دليل المستخدم يحتوي 
على الأوامر التي يجب أن يعرفها كل مستخدم؛ أما دليل المرجع Base‏ 
Reference Manual‏ يعر ض قائمة j‏ امر ستاتا مرتبة هجائياء وإدخالات الأو امر 
التي تتضمن اسم الأمر بالكامل» وشرح لكل المتغيرات والخيارات» à ul‏ 
وملاحظات Aii‏ عن الصيغ والشروط المنطقيةء وقائمة مراجع للحصول 
على معلومات أكثر عن ستاتا؛ أما بخصوص إدارة البيانات والرسومات 
البيانية والبيانات الأخرىء» فإنه تم تناولها في المراجع العامة. ولكن هذه 
المواضيع المعقدة تم تناولها بمزيد من التفاصيل والأمظة في الكتب 
المتخصصة؛ وهناك Ud‏ المرجع السريع والمؤشر A Quick Reference and‏ 
Index‏ الذي يحتوي على كل المواضيع التي تريد البحث عنها؛ بالرغم من أن 
الكتب التي تتحدث عن كيفية استخدام ستاتا موجودة بكثرة في أرفف 
المكتبات إلا أن نسخا إلكترونية متكاملة على شكل ملفات PDF‏ يمكن الوصول 
إليها ضمن برنامج ستاتا نفسه في أي وقت من خلال اختيار Help>PDF‏ 
Documentation‏ أو من خلال طباعة الأمر help‏ ثم طباعة اسم الأمر. 

عند القيام باستخدام ستاتاء فإنه من السهل الحصول على المساعدة 
وعرضها على الشاشة والتي بدورها يمكنها الاتصال مع أدلة اس تخدام 
ومراجع ستاتاء كما أن اختيار Help‏ من شريط المهام يؤدي إلى ظهور قائمة 
منسدلة تحتوي على العديد من الخيارات» والتي من ضمنها أوامر Stata‏ 
.Commano‏ ما هو الجديد «What's new?‏ تحديثات «Online updates‏ 
« جلة ستاتا «Stata Journal‏ البرامج المكتوبة بواسطة المستخدم USET-‏ 
«written programs‏ ورابط للاتصال مباشرة بصفحة ستاتا على الإنترنت 
twww.stata.com‏ أختيار Search‏ يسمح لك كمستخدم بطباعة GUIS‏ التي 
تبحت عنها ضمن مستندات .Stata's documentation Gu‏ كما يمكنك 
اختيار Contents‏ (أو طباعة الأمر (help‏ والذي يتيح لنا البحث والقيام 
ببعض المهام حسب تصنيفهاء الأمر help‏ يعتبر Wade‏ خصوصا عند استخدام 
اسم الأمر بعده» فمثلا طباعة help correlate jay‏ يعرض شرحا عن الأمر 
correlate‏ في نافذة معاينة» وهذه المساعدة تعرض لك اسم الأمر 
وتركيبته وقائمة ALIS‏ بالخيارات المتاحة مع الأمرء كما أنها أيضًا تتضمن 
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بعض الأمثلة ولكنها بدون شرح تفصيلي أو ملاحظات تقنية كما هو الأمر 
في AL‏ استخدام ستاتاء والمساعدة التي يتم عرضها على الشاشة لها عدة 
مميزات عن تلك الموجودة بدليل استخدام ستاتاء حيث إن نافذة المعاينة تسمح 
لك بالبحث باستخدام الكلمات الرئيسة في الملفات الموجودة في صفحة ستاتا 
على الإنترنت» كما أن الروابط تنقلك مباشرة إلى الأوامر IS‏ العلاقة 
إضافة إلى ذلك» فإن المساعدة على الشاشة قد تحتوي على بعض الملاحظات 
حول آخر التحديثات أو برامج ستاتا غير الرسمية» والتي يمكنك تحميلها من 
صفحة ستاتا أو من المستخدمين الآخرين لبرنامج ستاتا. 


Searching for Information : البحث عن اطعلومات'‎ 


عند اختيار Help » Search » Search documentation and‏ 
FAQs‏ يزودك بطريقة واضحة للبحث عن معلومات معينة في Ald‏ استخدام 
ستاتا أو فى صفحة الأسئلة المتكررة» والصفحات الأخرىء LS‏ يمكنك أيضا 
البحث ctis‏ ة في مجلة ستاتا ‘Stata Journal‏ و نتائج البحث تظهر في نافذة 
تحتوي على روابط عند النقر على أي منها سوف ينقلك إلى معلومات أكثر. 


ويقوم الأمر search‏ بنفس المهام» وأحد ay!‏ تخدامات الخاصة لامر 
search‏ هو البحث عن معلومات أكثر تفصيلا عن yal‏ معين لا يعمل كما 
يفترض» ولكن بدلا من ذلك يمكنك alll‏ بالنقر على الرقم الذي يظهر في 
رسالة الخطأ للحصول على هذه المعلومات. فعلى سبيل المثال table‏ هو أحد 
أوامر ستاتاء ولكنه يتطلب معلومات محددة عن ماذا نريد في الجدولء فإذا 
قمنا بطباعة أمر table‏ بذاته بدون أي شيء آخرء فإن ستاتا يعرض الرسالة 
Usi‏ التالية “return code" r(100):‏ 

.table 


varlist required 
r(100); 


" كل معلومات الدعم الفني والمساعدة في برنامج ستاتا تعرض باللغة الإنجليزية. 
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عند النقر على :(100: فإنه سوف يتم نقلك إلى معلومات مفيدة» والتي 
يمكننا كذلك الحصول عليها بواسطة كتابة الأمر 100 search rc‏ أو طباعة help‏ 
search‏ للحصول على معلومات حول أي أمر لستاتا. 


Stata Corp : شركة سثانا‎ 


العنوان البريدي لشركة ستاتا هو: 
Stata Corp‏ 
Lakeway Drive‏ 4905 
College Station, TX 77845 USA‏ 


وأرقام هواتف الشركة هي: 
من الولايات المتحدة 001-782-8272 (1-800-STATAPC) j‏ 


من كندا 001-782-8272 
باقي دول العالم 001-979-696-4600 
فاكس 001-979-696-4601 


c) candle ud‏ على :رخصية استعمال. أو معلومات isses]‏ ومكنك 
الاتصال بشركة ستاتا عن طريق البريد الإلكتروني: 

service@stata.com 

أو زيارة صفحة ستاتا على الإنترنت 

WWW.stata.com 

كما أن صفحة ستاتا على الإنترنت» بها جزء خاص بالإعلام 
والإصدارات الصحفيةء Ley‏ في ذلك المنشورات والبيانات التي تم استخدامها 
في أمثلة بعض الكتب. 

Www.stata-press.com 

وهناك مجلة ستاتا المحكمةء والتي أصبحت مصدرا مهما وموقعها 
www.stata-journal.com‏ 
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صفحة ستاتا الرئيسة wwwstatacom‏ تزود المستخدم بمعلومات مكثفة»› 
حيث إنها تبدأ بصفحات تشرح بالتفصيل منتجات ستاتاء وكيفية شراء منتجات 
ستاتاء والعديد من طرق دعم العملاء مثل: 


FAQs‏ وهي أسئلة متكررة مع أجوبتها عن بعض المشكلات التي لا 
توجد في أدلة استخدام ستاتاء الأسئلة تتنوع من أسئلة مثل "كيف تستطيع 
تحويل ملفات التطبيقات الإحصائية الأخرى إلى تنسيق ملفات ستاتا؟ إلى 
أسئلة ذات طبيعة تقنية أكثر مثل "كيف يمكنك وضع بعض المحددات على 
قيمة صفر باستخدام الأمر heckman‏ مع $ml‏ 

التحذيثات Updates‏ : أغلب Jae‏ ات ستانا iun, pall‏ يمن تصذيتها 
مجاناً للمستخدمين» وهذا يوفر طريقة سريعة وبسيطة للحصول على أحدث 
oly gl‏ والإضتلاحات. ١‏ الخ g acad‏ تقوم باشتخدانة فدلا شن 
الذهاب إلى صفحة Ga‏ على الإنترنت» يمكنك التأكد ما إذا كانت هناك أي 
تحديثات جديدة لبرنامج ستاتا الذي تقوم باستخدامه عن طريق طباعة الأمر 

.update query 

الدعم الفني: بالإمكان الحصول على الدعم الفني بواسطة إرسال بريد 
إلكتروني إلى crech-supportQostata.com‏ والردود في العادة تكون مفيدة» ولكن 
قبل إرسال بريد الكتروني يُفترض أن تقوم بمحاولة البحث عن حل لأي 
مشكلة من خلال FAQs‏ الأسئلة المتكررة. 


التدريب: بالإمكان التسجيل في بعض الدورات التدريبية على الإنترنت 
أف e oou: uod ual‏ سانا مال قم PL rg ee‏ 
برمجة ستاتاء أو برمجة ستاتا المتقدمة. 

أخبار ستاتا: تحتوي على معلومات حول مميزات البرنامج والدورات 
التدريبية وآخر القضايا الخاصة بمجلة ستاتا ومواضيع أخرى. 

المنشورات: هناك روابط عن مجلة ستاتاء ومستندات وأدلة اس تخدام 
ستاتاء وكذلك الكتب المعروضة للبيع عن ستاتاء وأحدث مراجع ستاتاء 
بالإضافة إلى برامج الدعم لمؤلفي كتب جديدة عن ستاتا؛ كما أن صفحة ستاتا 


40 الإحصاء مع برنامج ستاتا 





تستضيف منتدى خاصا بالنقاش حول مجلة ستاتا وكتب ستاتاء وروابطها 
وهذه يمكن الاطلاع عليها من خلال الرابط التالي: 
blgo.stata.com‏ 
مستخدمو مواقع التواصل الاجتماعي ربما يجدون أنه من الممتع والمفيد 
متابعة ستاتا على تويتر jowwwitwitter.com‏ اضغط معجب لصفحة ستاتا على 
الفيس بوك www.facebook.com‏ 


The Stata Journal : Wy dixo 


منذ سنة 1991 وحتى سنة 2001( كان هناك إصدار نصف شهري 
يسمى التقرير التقني لستاتا Stata Technical Bulletin‏ وتم استخدامه كوسيلة لنشر 
الأوامر الجديدة وتحديثات برنامج ستاتا للمستخدمين» وفي نهاية كل سنة يتم 
تجميع هذه التقارير ونشرها في كتاب يسمى إعادة طباعة التقارير التقنية 
لستاتا Stata Technical Bulletin Reprints‏ ويمكن شراء هذا الكتاب من شركة 
ستاتا مباشرة؛ ومع تطور الإنترنت أصبح الاتصال بالمستخدمين أمرًا سهلاء 
وملفات البرامج يمكن بسهولة تحميلها من الإنترنت من مصادر بعيدة 
وأصبح التقرير النصف oed‏ ي المطبوع لا يفي بحاجات المستخدمين 
ومعدي البرامج» لذلك فقد تم تغيير التقرير التقني إلى شكل آخر أحدث. 
مجلة ستاتا The Stata Journal‏ و التي تم إصدارها لتفي بالحاجات المتزايدة 
للعدد المتزايد لمستخدمي ستاتا؛ مجلة ستاتا تشبه التقرير = من حيث إنها 
تحتوي على مقالات تشرح أوامرستاتا الجديدة» والإصدار غير الرسمي 
لبعض الأوامرء والتي تم إعدادها بواسطة العاملين في شركة iG‏ التركيز 
الأساسي للمجلة ليس على الأوامر الجديدة فقطء وإنما أيضا على مقالات 
محكمة عن الإحصاءء ومراجعات للكتب» وملاحظات عن استخدام ستاتاء 
و عدد من الأعمدة المفيدة والتي منھا عمود Gli!‏ تتحدث" Speaking Stata‏ 
لكاتبه نيكو لاس كوكس Nicholas J. Cox‏ حول الاستخدام الفعال للنغفة برامج 
ستاتاء فمجلة ستاتا هي للمستخدمين المبتدئين والمحترفين على حد سواء 
فمثلا إليك محتويات مجلة ستاتا في عددها الصادر في يونيو 2012: 
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المقالات والأعمدة 
“A robust instrumental-variables estimator," R. Desbordes, V. Verardi‏ 


“What do hypotheses do “nonparametric” two-group tests actually test?" R.M. 
Conroy 


“From resultsses to resultstables in Stata,” R.B. Newson 
*Menu-driven X-12-ARIMA seasonal adjustment in Stata,” Q. Wang, N. Wu 


“Faster estimation of a discrete-time proportional hazards model with gamma 
frailty,” M.G. Farnworth 


“Threshold regression for time-to-event analysis: The stthreg package,” T. Xiao, 
G.A. Whitmore, X. He, M.-L.T. Lee 


“Fitting nonparametric mixed logit models via  expectation-maximization 
algorithm," D. Pacifico 


"The S-estim. tor of multivariate location and scatter in Stata," V. Verardi, A. 
McCathie 


“Using the margins command to estimate and interpret adjusted predications and 
marginal effects,” R. Williams 


“Speaking Stata: Tmsforming the time axis,” N.J. Cox 


- - 3 


ملاحظات وتعليقات 
“Stata tip 108: On adding and constraining,” M.L. Buis‏ 

"Stata tip 109: How to combined variables with missing values," P.A. Lachenbruch 
"Stata tip 110: How to get the optimal k-means cluster solution," A. Makles 


تحديتات Li pa)‏ 
يتم إصدار مجلة ستاتا بشكل ربع سنويء والاشتراكات في هذه المجلة 
يمكن أن تتم بزيارة ر ابط المجلة «www.stata-journal.com‏ كما يحتوي الموقع 
على قائمة أرشيف تتضمن كل الأعداد السابقة من المجلةء والتي يمكنك 
cle. SS las od‏ حدق كنا كنك كيل مقا لاك ca gad‏ الخدت الما هة 
مجاناء وذم إصدار عدد خاص من المجلة بمناسبة الذكرى العشرين (العدد 5 
المجلد 1 سنة 2005( احتوى العدد على مقالات حول تطور ستاتاء GLAS y‏ 
حول ستتا بعنوان "تاريخ قصير ela‏ :مع A short history of "Gli‏ 


Statistics with Stata 
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Books Using Stata : Ul عن استخدام‎ qui 





بالإضافة إلى أدلة استخدام ستاتا التي تأتي مع البرنامج نفسه؛ هناك نمو 
كبير في عدد الكتب التي تشرح ستاتا واستخداماته وتقنيات التحليل باستخدام 
ستاتا. هذه الكتب تحتوي على مقدمة ale‏ والتطبيقات المتعلقة به Jis‏ 
العلوم الاجتماعية أوالاقتصاد القياسيء كما يركز على النصوص المتعلقة 
colas «ola! blat‏ التجارت الباعملية» و المتدير ات Aina‏ اة 
ومواضيع أخرى. 
كما أن مكتبة بيع الكتب على صفحة ستاتا لديها قائمة حديثة مع شرح 
لمحتويات الكتب على الرابط التالى : 
http://www.stata.com/bookstore/‏ 
هذه المكتبة تزودك بمكان رئيس للتعرّف على أحدث الكتب المتعلقة 
ببرنامج ستاتا من مختلف ناشري هذه الكتب. فعلى سبيل المثالء هناك العديد 
من الكتب منها: 
A Gentle Introduction to Stata, A.C. Acock‏ 
Using Stata for Principles of Econometrics, L.C. Adkins, R.C. Hill‏ 
An Introduction to Modern Econometrics Using Stata, C.F. Baum‏ 
Applied Microeconometrics Using Stata, A.C. Cameron, P.K. Trivedi‏ 


Event History Analysis with Stata, H-P. Blossfeld, K. Golsch, G.Rohwer 


An Introduction to Survival Analysis Using Stata, M. Cleves, W. Gould, R. 
Gutierrez, Y. Marchenko 


Statistical modeling for Biomedical Researchers, W.D. Dupont 

Maximum Likelihood Estimation with Stata, W. Gould, J. Pitblado, B. Poi 
Statistics with Stata, L.C. Hamilton 

Generalized Linear Models and Extensions, J.W. Hardin, J.M . Hilbe 
Negative Binomial Regression, J.M. Hible 

A Short Introduction to Stata for Biostatistics, M. Hills, B.L. De Stavola 


Applied Survival Analysis: Regression Modeling of Time to Event Data, D.W. 
Hosmer, S. Lemeshow, S. May 


Applied Econometrics for Health Economists, A. Jones 
Applied Health Economics, A. Jones, N. Rice, T.B. d'Uva, S: Balia 
An Introduction to Stata for Health Researchers. S. Juul, M. Frydenberg 
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Data Analysis Using Sata. U. Kohler, F. Kreuter 
Sampling of Populations: Methods and Applications, P.S. Levy, S. Lemeshow 
Working in Data Analysis Using Stata, J.S. Long 


Regression Models for Categorical Dependent Variables Using Stata, J.S. Long, J. 
Freese 


A visual Guide to Stata Graphics, M. Mitchell 

Data Management Using Stata: A Practical Handbook, M. Mitchell 

Interpreting and Visualizing Regression Models Using Stata,M. Mitchell 
Seventy-six Stata Tips, H.J. Newton, N. J. Cox editors 

Analyzing Health Equity Using Household Survey Data, O. O'Donnell and others 
A Stata Companion to Political Analysis, P.H. Pollock III 

A Handbook of Statistical Analyses Using Stata, S. Rabe-Hesketh, B. Everitt 
Multilevel and Longitudinal Modeling Using Sata, S. Rabe-Hesketh, A. Skrondal 
Managing Your Patients? Data in the Neonatal and Pediatric ICU, J. Schulman 
Epidemiology: Study Design and Data Analysis, M. Woodward 





4) 


ou 
إدارة البيانات‎ 


Data Management 





salio‏ في تحليل البيانات تتضمن تنظيم صفوف البيانات» في شكل 
يمكن به معرفة مفهوم برنامج ستاتا. يمكننا إدخال بيانات جديدة إلى ستاتا 
باستخدام عدة طرق: طباعة البيانات باستخدام لوحة المفاتيح» استيراد 
البيانات من برامج أخرى مثل برنامج مايكروسوفت إكسيلء قراءة البيانات 
من ملف نصي أو ملف ASCH‏ يحتوي على صفوف البيانات» لصق البيانات 
من جداول في المحررء أو استخدام برنامج يقوم بتحويل البيانات» ترجمة 
البيانات مباشرة من ملف نظام تم إنشاؤه بواسطة برنامج جداول إليكترونية 
آخرء أو قاعدة بيانات» أو برنامج إحصائي آخر. عند إدخال البيانات في 
برنامج ستاتا يمكننا حفظها في ملف بتنسيق ستاتاء بحيث يسهل إعادة فتحه 
وتحديثه مستقبلا باستخدام ستاتا. 


إدارة البيانات تتضمن: المهام الأساسية التي عن طريقها يتم إنشاء ملف 
البيانات وتحرير هذه البيانات وتصحيح الأخطاءء وتحديد البيانات المفقودة. 
وإضافة مستندات داخلية مثل. المتغيرات والقيم والأسماء. كما أن إدارة 
البيانات تتضمن: العديد من الوظائف التي تتطلبها عملية التحليل مثل إضافة 
مشاهدة جديدة dou‏ متغير جديدء وإعادة التنظيمء واختيار عينة من البيانات» 
وفصل وتجميع أو إلغاء بيانات» وتحوير أنواع المتغيرات» وإنشاء متغيرات 
من خلال شروط منطقية أو رياضية معينة.وعندما تكون عملية إدارة 
البيانات متكررة أو معقدة» فإن مستخدمي ستاتا يمكنهم كتابة برنامج خاص 
بهم لإجراء العمليات بشكل تلقائي» Cus‏ إن ستاتا معروف بقدرته التحليلية 
الفائقة» فيمكنه التعامل مع بيانات cde giia‏ وكذلك إدارة مميزاتها. 
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دليل المستخدم لبرنامج ستاتا User's. Guide‏ يعطي نظرة عامة على 
الطرق المختلفة لإدخال البيانات» ثم بعد ذلك يشرح تسع قواعد لتحديد 
الطريقة المناسبة. إدخال البيانات وتحريرها والعديد من المهام الأخرى. 
سوف تتم مناقشتها في هذا الفصلء ويمكن القيام بهذه المهام من خلال قائمة 
«Data‏ وهي تحتوي على القوائم الفرعية التالية: 

Describe data - 

Data Editor — 

Create or change data - 

Variables Manager - 

Data utilities — 

Sort - 

Combine datasets - 

Matrices, Mata language - 

Matrices, ado language - 

Other utilities — 


أمثلة عن الأوأمر : Example Commands‏ 





.append using olddata 

قم بقراءة ملف البيانات المخزن مسبقا olddata.dta‏ ثم قم بإضافة 

مفرداته إلى ملف البيانات المستخدم حالياء بعد ذلك قم بكتابة الأمر 

save newdata, replace‏ فسوف يتم has‏ البيانات الموحدة في ملف جديد 
newdata.dta anıl‏ 


.browse 

هذا الأمر يقوم بفتح جدول إلكتروني يشبه متصفح البيانات لمشاهدة 

بيانات» والمتصفح يشبه محرر البيانات» ولكن ليس لديه القدرة على تحرير 

البيانات» فلايوجد هناك خطر على تغيير البياناات بشكل غير مقصود؛ 
ويمكنك القيام بنفس-الأمر بالنقر على أيقونة قف 


-browse year month extent if year» 1999 
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هذا الأمر يفتح متصفح البيانات. ويعرض ففط المتغيرات year, month,‏ 
extent‏ كما يعرض المشاهدات التي تم إدخالها في سنة year‏ 1999 وما 
بعدهاء في هذا المثال if‏ تمثل الشرط المنطقي والذي يجب استخدامه Jay‏ 
الغديد :من Gall‏ كان sl‏ ر Aus‏ 
.Compress‏ 
يقوم هذا الأمر بشكل تلقائي بضغط البيانات» وتحويل كل المتغيرات إلى 
أكثر أشكال التخزين كفاءة للمحافظة على السعة التخزينية للجهاز» ثم بعد 
ذلك قم بكتابة save filename, replace jy!‏ وهذا سوف يحفظ 'تغييرات 
بشكل دائم. ١‏ 
.drawrorm Z1 z2 z3, n(5000)‏ 
يقوم هذا الأمر بإنشاء بيانات تحتوي على 5000 مشاهدة و3 متغيرات 
عشوائية هي 23 ,22 ,/2. وهذه البيانات غير ALS yo‏ وتتوزع توزيعاً 
طا (Say ba ilies‏ تاها تيده wal SV s dera gall‏ 
المعياري ومصفوفات الارتباط. 
0208155 
وهذا الأمر يقوم LEW‏ بحذف أي متغير يحتوي على قيم مفقودة لكل 
المشاهداتء هذا الأمر يعتبر Made‏ عند العمل مع كمية كبيرة من cL shall‏ 
حيث إن بعض المتغيرات الأصلية غير متعلقة بأي مشاهدة من المشاهدات 
المتبقية؛ وكتابة الأمر dropmiss, obs‏ سوف يقوم باستبعاد أي مشاهدات لها 
قيم مفقودة؛ ب جب ملاحظة أن dropmiss‏ أمر تم برمجته بواسطة أحد 
المستخدمين: فهو لايأتى ضمن الأوامر الافتراضية فى ستاتاء لذا يجب 
تافهن va)‏ رت ي fcc gy Bb‏ ع ر diss de‏ 
عن طريقة طباعة الأمر -findit dropmiss‏ 
.edit‏ 
يقوم بفتح نافذة بها جدول البيانات. Cus‏ يمكنك إدخال وتحرير 
البيانات؛ ويمكن القيام بنفس الأمر بالنقر على أيقونة ك تحرير من شريط 
المهام. 
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.edit year month extent‏ 
يقوم بفتح نافذة تحرير البيانات للمتغيرات year, month, extent‏ على 
التوالي» ويمكنك تعديل البيانات حسب الحاجة. 
.encode stringvar, gen (numvar)‏ 
يقوم هذا الأمر بإنشاء متغير جديد اسمه numvar‏ مع توصيفه بقيم رقمية 
ol‏ على متغير نصي (غير رقمي) اسمه stringvar‏ 
.format rainfall 58 . 2‏ 
يقوم هذا الأمر بإنشاء تنسيق عرض ثابت f)‏ ) للمتغير الرقمي rainfall‏ 
Lay deal B. Seal d jae ses COS) usd‏ يظهن ركان Alcala‏ 
العشرية؛ هذا الأمر يؤثر فقط في كيفية عرض البيانات» ولإ يؤثر في 
البيانات نفسها. 
generate newvar = (x+y)/100‏ 
يقوم yall‏ بإنشاء متغير جديد اسمه newvar‏ وهو يساوي TRE‏ إليها 
بروالناتج مقسم على 100. 
generate newvar = runiform( )‏ 
يقوم هذا الأمر بإنشاء متغير جديد من قيم تم أخذها من توزيع عشوائي 
منتظم» تتراوح مابين 0 وتقريباً 1 وتكتب (0,1]. وللحصول على معلومات 
عن الدوال التي تقوم بإنشاء lly‏ عشوائية من التوزيع الطبيعي» والتوزيع 
الثنائي» وتوزيع ?0 وتوزيع جاماء وتوزيع بواسون» والتوزيعات الأخرى قم 
بكتابة الأمر .help random‏ 
.import excel filename.xlsx, sheet ("mean")‏ 
cellrange (a15:n78) firstrow‏ 
يقوم هذا yo‏ باستيراد ورقة إكسيل داخل برنامج ستاتاء والخيار الثاني 
في هذا المثال» يوضح أن اسم الورقة هو "mean".‏ والتي تحتوي على 
بيانات فى الخلايا من ۸15 إلى N78‏ والصف الأول من هذه الخلايا يتضمن 
e aud‏ التو e‏ 


.infile x y z using data.raw 
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هذا الأمر يقوم بقراءة الملف المسمى data. raw.‏ والذي يتضمن بيانات 
ثلاثة متغيرات هي z‏ بر x,‏ والقيم المتعلقة بهذه المتغيرات الثلاثة تم الفصل 
بينها بمسافة واحدة (يمكن استخدام الفراغات ومسافة Jal sills TAB‏ 
والخطوط)ء المسافات تحدد القيم المفقودة للمتغيرات الرأقميةء والتي يجب أن 
يتم تمثيلها بواسطة الفترات وليس الفراغات؛ استخدام الفاصلة كحد فاصل 
بين القيم والفراغات أو فاصلتين متتاليتين للقيم المفقودة. وللحصول على 
تفاصيل أكثر عن الأوامر التي تقوم بقراءة البيانات من ملفات مختلفة 
واستيرادها Jala‏ ستاتا قم بطباعة الأمر -help infiling‏ 
.list =‏ 
يقوم بعمل قوائم للبيانات في التنسيق الافتراضي للجداول؛ عند العمل مع 
حجم lily‏ ضخم» فإن تنسيق الجداول يصبح Ange‏ صعبةء لذا فإن استخدام 
الأمر list‏ والأمر display‏ يعطي نتائج مفيدة. للحصول على معلومات عن 
الخيارات الأخرى المتوافرة مع هذا الأمرء قم طباعة الأمر thelp list‏ كما 
ol‏ محرر البيانات Data Editor‏ ومتصفح البيانات Data Browser‏ يوفر 
العديد من الخيارات للمعاينة حسب الغرض المطلوب. 
.list x y z in 5/20‏ 
يقوم هذا الأمر بعمل قائمة بالمتغيرات ox, y, z‏ والقائمة تتضمن 
المشاهدات من المشاهدة رقم 5 إلى المشاهدة رقم 20 حسب تسلسل إدخالها. 
emerge 1:1 id using olddata‏ 
يقوم هذا الأمر بقراءة البيانات المخزنة مسبقاً بملف olddata.dta‏ 
للمتغير id‏ ثم يقارن المشاهدات الموجودة بالملف مع تلك المشاهدات 
الموجودة بالملف الحالي المفتوح» حيث تتم مقارنة المشاهدات واحدة Baal g‏ 
ويجب أن يتم ترتيب bly‏ الملفين وفقا للمتغير „id‏ 
-mvdecode var3-var62, mv(97=.\98=.a\99=.b)‏ 
بالنسبة للمتغيرات من var3‏ وحتى var62‏ قم باعتبار القيم 97. 98 99 
على أنها قيم مفقودة. في هذا المثال» نحن نستخدم ثلاشة رموز مختلفة 
لتعريف القيم المفقودة وهي a, b‏ هذه القيم يمكن الاستعاضة عنها باستخدام 
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أسباب نقص هذه القيم مثل كتابة غير قابلة للتطبيق «Not applicable‏ غير 
معروف «Don't know‏ رفض الإجابة Ja} ‘Refused to answer‏ كان 
المطلوب هو استخدام رمز واحد للقيم الناقصة. إذن يمكننا تحديد رمز واحد 
للقيم المفقودة» فإذا قمنا باستخدام (.) فإن الأمر يمكن كتابته ).=99 98 mv(97‏ 

.replace oldvar - 100 * oldvar 


يقوم الأمر باستبدال قيم المتغير oldvar‏ بقيم جديدة تم حسابها بضرب 
القيم القديمة للمتغير القديم في 100. 
-sample 10‏ 
يقوم الأمر بحذف US‏ المفردات في الملف الحالي المفتوح باستتناء 
0 سوف يتم الإبقاء عليها كعينة عشوائية؛ فبدلا من اختيار نسبة محددة 
يمكننا اختيار عدد محدد من الحالات؛ sample 55, count Wiad‏ سوف يقوم 
dta 55 Leaxa. Aue o tal cla tall US cisci‏ 
-save newfile‏ 
يتم حفظ البيانات في الملف المفتوح Lalla‏ والمسمى -newfile.dta‏ إذا 
كان الملف newfile.dta‏ موجوذ! مسبقاء وتريد الكتابة على الإصدار السابق؛ 
يمكنك كتابة الأمر «save newfile, replace‏ أو يمكنك القيام بنفس المهمة عن 
طريق قائمة «File‏ ولحفظ الملف newfile.dta‏ بتنسيق ستاتا 9 قم بكتابة الأمر 
newfile‏ 63 أو قم .File > Save As > Save as type Jib‏ 
.Sort x‏ 
يقوم هذا الأمر بترتيب مشاهدات المتغير × تصاعدياً من أقل قيمة إلى 
أعلى قيمةء وتظهر القيم المفقودة في نهاية القائمة» GY‏ برنامج ستاتا يعتبر 
القيم المفقودة أعلى قيم. للحصول على معلومات أكثر حول أمر الترتيب 
العام» قم بطباعة الأمر Cus help gsort‏ يوفر معلومات عن خيارات 
الترتيب تنازلياء أو تصاعدياء أو وضع القيم المفقودة في البداية. 
.tabulate x if y» 65 is‏ 
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يقوم هذا الأمر بإنشاء جدول تكراري للمتغير × فقط باس تخدام 
المشاهدات التي يناظرها المتغير y‏ يزيد على 65؛ استخدام if‏ يشبه تماما 
استخدامها مع معظم أوامر ستاتا الأخرى 
.use oldfile‏ 
PUE‏ باستخدام ملف البيانات المخزن مسبقاً باسم -oldfile.dta:‏ 
13 كان هناك ملف بيانات مفتوح حالياء وتريد إلغاء هذه البيانات بدون حفظها 
فيمكنك طباعة الأمر use oldfile, clear‏ أو يمكنك القيام بنفس المهمة عن 
طريق اختيار File > Open‏ أو الضغط على أيقونة ت 
إنشا؟ بيانات بطباعنها ي Data o1396‏ : 
Creating a New Dataset by Typing in Data‏ 


البيانات التي تم حفظها مسبقاً في ملف ستاتاء يمكن اس تخدامها بفتح 
الملف المخزن بأمر use filename‏ أو من خلال القوائم. في هذا ce jal‏ سوف 
يتم شرح المهارات الأساسية لإنشاء ملف بيانات باستخدام برنامج ستاتاء 
cus‏ يمكننا ببساطة طباعة البيانات Uo‏ في نافذة تحرير البيانات Data‏ 
cEditor‏ أوإدخال البيانات يدويا. وهذا يعتبر عملياً عندما يكون حجم البيانآت 
بسيطا أو البيانات ليست مخزنة على وسيلة إلكترونية مثل ملف إكسيل» ولكن 
هناك العديد من الطرق الأخرى لإدخال البيانات. 

الجدول )1.2( يعرض بعض المعلومات عن الولايات والأقاليم الكندية؛ 
وهذه البيانات يمكن استخدامها لتوضيح كيفية إدخال البيانات يدويا. تم 
الحصول على هذه البيانات من لجنة الإشراف الإقليمية البلدية الاتحادية على 
صحة السكان لسنة 1996( أحدث أقاليم كندا (Nunavut)‏ لم يتم إدراجها 
ضمن البيانات» وذلك لأنها كانت Wh Te je‏ من الأقاليم الشمالية الغربية 
حتى ài,‏ 1999. 
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جدول (1.2) : بيانات عن كندا وولاياتها 


العمر المتوقع 
للإناث 
(سنوات) 
Female Life‏ 


Expectancy 
fears} 


Unemployment 
Rate (percent) 


Male Life 
Expectancy 


(1000's) 
(years) 
29606. 1 


575.4 
136.1 


937.8 
760.1 
7334.2 
11100.3 
1137.5 
1015.6 
2747.0 
3766.0 
30.1 


65.8 





شاء ملف بيانات من بيانات de sila‏ على $55( Q—À‏ 


1995 Pop. 


Canada 
Newfoundland 


Prince Edward 
Island 


Nova Scotia 
New Brunswick 
Quebec 

Ontario 
Manitoba 
Saskatchewan 
Alberta 

British Columbia 
Yukon 


Northwest 
Territories 


أسهل طريقة لإنش 


الجدول (1.2) هي استخدام نافذة تحرير البيانات Data Editor‏ والتي تظهر 
من خلال النقر على c4‏ أو من خلال اختيار Window > Data Editor‏ من 
قائمة ستاتا أو من خلال طباعة الأمر cedit‏ ثم بعد ذلك قم بطباعة قيم كل 
متغيرء الأعمدة تتم تسميتها cvar2 «var‏ الخ؛ لذلك فإن var]‏ يحتوي على 
بيانات المكان «place‏ و var2‏ يحتوي على بيانات عدد السكان وهكدا. 


يمكننا وضع أسماء أكثر تعبيراً عن المتغيرات وذلك بالنقر على أعلى 
كل عمود Se)‏ المتغير (var?‏ في نافذة تحرير البيانات» تم كتابة الاسم 
الجديد في مربع حوار النتائج» بالرغم من أن اسم المتغير يمكن أن يحتوي 
على 32 (os‏ إلا ail‏ من المفضل أن يتكون من 8 حروف أو أقلء > كما 
ita,‏ اشا أن نشم ويفا تفن شرا pte‏ لانم Mad pall‏ 
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gw" e" ويعطى شر‎ pop يمكن تسميته‎ (population (عدد السكان‎ 2 
"Population in 1000s, 1995" cans variable lable في حقل‎ 





Fie Edit View Data Tools 


: $d a و7 نكا‎ Paty 


var 1(1] ET 


Newfoundi and 575.4 











Vars: 5 Order: Dataset Obs: 2 Fiter: off Mode: Edt Corg 





إعادة تسمية المتغيرات يمكن أن تتم في نافذة تحرير البيانات «Data Editor‏ 
أو من خلال استخدام الأو labelvariable 5 rename jl‏ كما يلي: 
.rename 7322205‏ 
.label variable pop "Population in 1000s, 1995"‏ 
الفضاءات التي تم تركها خالية» مثل معدلات البطالة unemployment rates‏ 
Northwest Territories s Yukon OLY s!‏ سوف يعتبرها ستاتا [sadi (sak‏ 
مفقودة» ويمكننا إغلاق نافذة 5 تحرير البيانات في أي cay‏ وحفظ البيانات في 
الجهاز؛ عند الضغط على أيقونة تحرير البيانات لت أو Data » Data DM‏ 
Editor‏ أو طباعة الأمر edit‏ سوف يتم إرجاعك إلى نافذة تحرير البيانات. 
إذا كانت القيمة الأولى التي تم إدخالها لمتغير ما رقم. - مثل عدد السكان 
can .; unemployment rate åh (Jas 9 population‏ المتوة فنع life‏ 
expectancy‏ — فإن ستاتا سوف يعتبر العمود متغيرًا Oe‏ ولاحقا سوف 
يسمح فقط بقيم رقمية لذلك المتغير. القيم الرقمية يمكن أن تبدأ بعلامة زائد 
أو ناقص» ويمكن أن تتضمن علامة عشرية أو تعبيرات رياضية. فمثلاً 
يمكننا التعبير عن عدد سكان كندا كرقم 2.960616+7 وهذا يساوي 2.96061 
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x 107‏ أي حوالي 29.6 مليون نسمة؛ يُفترض ألا تحتوي الأرقام على أي 
فواصل مثل 29.606.100 (ويمكن استخدام الفواصل كعلامات عشرية). وإذا 
حدث هذاء فإن ستاتا سوف يعتبر المتغير كمتغير نصي وليس متغيرا 
رقميا. 
إذا كانت القيمة الأولى التي تم إدخالها لمتغير ما حرفا وليست رقما 
Uia -‏ اسم المكان في الجدول السابق — فإن ستاتا سوف يعتبر ذلك المتغير 
كر Lune I‏ "فد NS CERO ill‏ أن CET MPEG MU STO:‏ 
دات حكن 244 uci caos‏ أت daas‏ ينعن أن خط APE‏ 
وعلامات تنصيص وأي معلومات توضيحية أخرى» كما يمكن وضع 
المتغيرات النصية في جداول ويمكن عذهاء ولكن لا يمكن تحليلها باس تخدام 
المتوسط الحسابي والارتباط أو أغلب العمليات الإحصائية الأخرىء وفي 
نافذة محرر البيانات Data Editor‏ أو نافذة متصفح البيانات Data Browser‏ 
تظهر المتغيرات النصية بلون أحمر يميّزها عن المتغيرات الرقمية التي 
تظهر بلون أسود أو أسماء المتغيرات الرقمية (الزرقاء). 
بعد طباعة المعلومات من الجدول )1.2( سؤف نقوم DEL‏ نافذة محرر 
البيانات Data Editor‏ وحفظ البيانات Canadal.data awl‏ وذلك بالأمر 
.save Canadal‏ 
برنامج ستاتا سوف يقوم تلقائيا بإضافة امتداد dra‏ إلى ملف البيانات ما 
لم تقم بكتابة أي شيء آخرء إذا كنا قد Lind‏ بتخزين الملف مسبقا بنفس الاسم 
فإنه من المحتمل أن يتم تخزين الإصدار الأحدث من نفس الملفء وذلك 
بطباعة الأمر التالي: 
.Save, replace‏ 
عند هذه النقطة ملف البيانات سوف يظهر كما يلي: 


. describe 
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Contains data from C:\data\Canadal.dta 





obs: 13 Canadian dataset 1 
vars: 5 4 Jul 2012 11:21 
size: 481 
storage display value 

variable name type format label. variable label 

place str21 %21s Place name 

pop float %9.0g Population in 1000s, 1995 
unemp float %9.0g % 15+ population unemployed, 1995 
mlife float 59.09 Male life expectancy years 
flife float %9.0g Female life expectancy years 
Sorted by: 

0 

.list 


pop unemp mlife 


Canada 

Newfoundland 

Prince Edward Island 
Nova Scotia 

New Brunswick 


wN‏ ص صن 


6 Quebec 
23 Ontario 
8. Manitoba 
3 Saskatchewan 
0 Alberta 


11. Bricish Columbia 
12. : "Yukon 
13. Northwest Territories 





.Summarize 


Variable Obs Mean Std. Dev. Min Max 





pop 13 4554.769 8214.304 30.1 29606.1 
var3 11 12.10909 4.250048 7 19.6 
var4 13 74.29231 1.673052 70.2 75.8 
vars 13 80.71539 9754027 78 81.8 


اختبار مثل هذه المخرجات يعطينا الفرصة لرؤية الأخطاء التي يُفتر 
أن يتم تصحيحهاء E‏ جدول summarize‏ يوضح مجموعة من ar‏ 
المفيدة Anal yall‏ وهذه الأرقام تتضمن عذد المشاهدات الرقمية Las)‏ 0 
للمتغيرات النصية) وأقل وأعلى قيمة لكل متغيرء التفسير الموضوعي 
للإحصائيات المختصرة عند هذه النقطة سابق لأوانهء GY‏ البيانات تحتوي 
على مشاهدة واحدة (كندا) والتي تمثل دمجا لباقي 12 ولاية. 
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الخطوة التالية هي إعطاء البيانات توثيقا ذاتيا أكبر من خلال إعطاء 
المتغيرات انتما أكثر وضوحاء وذلك كما يلي: 

.rename var1 place 

.rename var3 unemp 


.rename var4 mlife 


.rename var5 flife 


ويمكن القيام بنفس المهمة في خطوة واحدة كما يلي: 


„rename (vari var2 var4 var5)(place unemp mlife 
flife) 


يتيح U‏ برنامج ستاتا إضافة bac‏ أنواع من التوصيفات إلى البيانات؛ 
الأمر label data‏ يشرح البيانات Lay «dias‏ الأمر label variable‏ يشرح كل 

متغير على das‏ وذلك LS‏ يلي: 
.label data "Canadian dataset 1"‏ 


.label variable place "Place name" 


.label variable unemp "9615-4 population 
unemployed, 1995" 


.label variable mlife "Male life expectancy 
years" 


.label variable flife "Female life expectancy 
years" 


بإعطاء وصف للبيانات والمتغيرات: سوف نحصل على بيانات توضح 
نفسها بنفسها من خلال التوصيفات: 
describe‏ . 


Contains data from C:\data\Canadal.dta 








obs: 13 Canadian dataset 1 

vats: 5 4 Jul 2012 11:21 

size: 481 

Storage display value 

variable name type format label variable label 
place str21 285 Place name 
pop float $9.0g Population in 1000s, 1995 
unemp float %9.0g % 15+ population unemployed, 1995 
mlife float %9.0g Male life expectancy years 
flife float %9.0g Female life expectancy years 





Sorted by: 
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عند إنهاء توصيف المتغيرات يُفترض أن نقوم بحفظ هذه المتغيرات 
باختيار File < Save‏ أو بكتابة الأمر 
.Save, replace‏ 
cay‏ سوف نقوم بفتح ملف البيانات بالنقر على أيقونة ت باختيار 
File > Open‏ أو بكتابة الأمر 
.use C:\data\Canadal‏ 
يمكننا الان التقدم في Aulae‏ تحليل البياناتء ربما تلاحظ أن هناك 
ارتباطا إيجابيا بين العمر المتوقع للذكور mlife‏ والإناث flife‏ وهذان 
المتغيران يرتبطان بشكل سلبي مع معدل البطالة memp‏ الارتباط بين العمر 
المتوقع ومعدل البطالة يكون أقوى للذكور منه للإناث. 


.Correlate unemp mlife flife 





(obs=11) 
unemp mlife flife 
unemp 1.0000 
mlife -0.7440 1.0000 
flife -0.6173 0.7631 1.0000 


ترتيب المشاهدات في ملف البيانات يمكن تغييره باستخدام الأمر sort‏ 
Wid‏ لإعادة cas i‏ المشاهدات:من caus SD. RAM‏ متغير عند (ESI‏ 
قم بطباعة الأمر التالي: 
.Sort pop‏ 
المتغيرات النصية يمكن ترتيبها أبجدياء فطباعة الأمر sort place‏ 
سوف يعيد ترتيب المشاهدات ia British Columbia E Alberta lj.‏ 
وهكذا. 
الأمر order‏ يقوم بترتيب المتغيرات.في Loe S uic etal caa‏ 
وضع معدل ase y clit Alla‏ السكان dosi‏ بظاعة الامو : 
-order place unemp mlife flife pop‏ 
محرر البيانات Data Editor‏ توجد به قائمة Tools‏ وبها aae‏ من الخيارات 
التي يمكن أن تقوم بنفس. المهام السابقة. 





58 الإحصاء مع برنامج ستاتا 





يمكننا إجراء تحديد للمتغيرات المراد العمل عليها في نافذة محرر البيانات 
Data Editor‏ بحيث تعرض فتط المتغيرات التى يُراد تغييرها أو إدخال بيانات بهاء 
DE MORE CIE‏ يرات فى E‏ محرو البيانات: 
.edit place mlife flife‏ 
di‏ 
.edit place unemp if pop» 100‏ 
الأمر الأخير يستخدم if‏ والتي تعتبر أداة Ange‏ وسوف يتم شرحها في 
الأجزاء اللاحقة. 
أنشاء ملف بيانات جديد باستخدام نسخ Copy‏ ولصف Paste‏ : 
Creating a New Dataset by Copy and Paste‏ 


عندما تكون البيانات الأصلية مخزنة على وسيلة إليكترونية مثل صفحة ويب 
أو ملف نصي أو ملف إكسيل أو ووردء فيمكننا جلب هذه البيانات لبرنامج ستاتا 
باستخدام copy‏ و tpaste‏ فمثلاً مركز بيانات المناخ الوطني National Climate‏ 
Data (NCDC) Center‏ يعرض توقعات درجات الحرارة العالمية غير الاعتيادية 
(الانحرافات عن متوسط درجات الحرارة في الفترة ما بين 1901 إلى 2000 
بالدرجات المئوية) لكل شهر في الفترة الماضية حتى يناير .41880 مؤشر 
NCDC‏ هو أحد المؤشرات التي تعتمد على شبكة عالمية للبيانات من محطات 
الأرصادء وقياسات حرارة سطح البحرء ويقؤم NCDC‏ بتحديث المؤشر شهرياء 
وينشر هذه التحديثات على الإنترنت؛ وأدناه الخمسة أشهر الأولى من هذه 
البيانات» أول قيمة 0.0623- تشير إلى أن يناير 1880 كان °C Ladle‏ 0.06 أكثر 
برودة من متوسط درجات الحرارة في القرن العشرين. 


1880 |  -0.0623 
1880 2  -0.1929 
1880 3  -0.1966 
1880 4 -0.0912 


1880 5  -0.1510 
على تفاصيل كيفية تنظيم البيانات الخام (بما فيها القيم المفقودة) قد‎ tly 
في نافذة محرر‎ paste البيانات ككل ثم لصقها‎ copy لايمكننا استخدام نسخ‎ 
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البيانات «Data. Editor‏ فقد يتم توسيط خطوة أخرى مفيدة وذلك من خلال 
وضع فاصلة بين (edil‏ وأسهل طريقة لعمل ذلك تتم من خلال نسخ جميع 
الأرقام ثم لصقها في نافذة الملف التنفيذي لبرنامج Do-File Editor Gti‏ 
وهذه النافذة عبارة عن محرر بيانات بسيط يحتوي على العديد من التطبيقات. 
ثم قم باستخدام وظيفة استبدال في نافذة الملف التنفيذي من خلال 
اختيار Edit < Find < Replace‏ وذلك لاستبدال كل المسافتين الموجودتين 
بين البيانات بمسافة baal g‏ قم بتكرار هذه الخطوة عدة مرات حتى يتم حذف 
كل المسافتين وجعلها مسافة واحدة بين كل البيانات» ثم آخر خطوة هى 
استبدال الكل Replace All‏ المسافة الواحدة بفاصلة؛ بذلك نكون قد قمنا 
باستخدام Editor‏ 20-5316 لوضع فواصل بين القيم» وبذلك تكون البيانات في 
تنسيق معروف لكثير من البرامج» كما يمكننا Laf‏ وضع أسماء المتغيرات 
في الصف الأول مع إضافة فواصل بينهاء وتكون البيانات على الشكل التالي: 

year,month,temp 

1880,1, -0.0623 

1880,2,-0.1929 

1880,3, -0.1966 


1880,4,-0.0912 
1880,5,-0.1510 


يمكننا GY!‏ نسخ البيانات من Do-File Editor‏ باختيار Edit > Select All‏ 
ولصق البيانات في نافذة محرر بيانات خالية في برنامج ستاتاء وذلك باختيار 
Paste Special‏ مع فاصلة Comma‏ تم حدد الخيار Treat first row as‏ 


-variable names 


Bill Data Editor (Edit) - [Untitled] 3 و اا‎ a 3 X sums {Oo} xi 





Fée Edit View Data Tools 
jd ads yu. 


vear[1] - 1880 





temp 
-.0623 
7.1929 
-.19660001 





; Sjousdeus 1+ 








7.0912 
-.15099999 
-.1886 
-.1716 











, 7.1025 
-.1072 


> Ow onannewne 
0 wmv ans uNe 


au 
5-5 


7.18430001 
= a 


Ready id Vars: 3 Order: Dataset 








60 الإحصاء مع برنامج ستاتا 





القيام بوضع فواصل بين القيم في ملف أمتداده «(.csv)‏ يمكن القيام تة 
باستخدام أي برنامج جداول إلكترونية أو باستخدام برنامج ستاتا نفسه»ء والذي 
يجعل البيانات قابلة للنقل بشكل Qu‏ ولقراءة ملف امتدادہ sv‏ باس تخدام 
ستاتا مباشرة يمكن طباعة الأمر insheet‏ وذلك كما يلي 
.insheet using C:\data\globall.csv, comma clear‏ 
عند فتح البيانات في برنامج ستاتاء يمكننا إضافة توصيف للمتغيرات 
والبيانات» ثم حفظ النتائج في ملف ستاتا كما يلى: 
.label data "Global climate"‏ 
.label variable year "Year"‏ 


.label variable month "month" 


.label variable temp "NCDC global temp anomaly 
vs 1901-2000, c" ` 


.save csNdataNgloball.dta 


a 
.describe 
Contains data from C:\data\globall.dta 
obs: 1,584 Global climate 
vars: 3 4 Jul 2012 11:21 
size: 11,088 
storage display value 
variable name type format abel variable label 
year int $8.0g Year 
month byte 38 . و0‎ Month 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, C 
Sorted by: 


: if و‎ in البيانات باستخدام اطحددات‎ à» فئان فرعية‎ ins 
Specifying Subsets of the Data: in and if Qualifiers 
العديد من أوامر ستاتا يمكنها تحديد فئة البيانات التي تعمل معهاء وذلك‎ 
إلى الأمر نفسه»ء كما أن هذه المحددات متوافرة‎ if أو‎ in بإضافة المحددات‎ 
في أعلى نوافذ‎ by/iffin أو‎ ifin في العديد من قوائم ستاتا: ابحث عن‎ 
يطلب من ستاتا أن يقوم بعمل قائمة‎ ist in 5 الحوار. فعلى سبيل المثالء‎ 
للخمس مشاهدات الأولىء ولعمل قائمة بالخمس مشاهدات الأولى» قم بطباعة‎ 
الأمر.‎ 


5 vd 


.list in 1/5 
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year month 


بر رح € Ui»‏ 





الحرف )1( في الأمر أعلاه يحدد آخر Gabia‏ و(10-) يقوم بتحديد 
المشاهدة رقم )10( من أسفل القائمة. فبيانات Gla ja‏ الحرارة العالمية التي 
تغطي فترة 1584 شهرا تحتوي على أعلى )10( أشهرء والتي كانت فيها 
درجات حرارة غير اعتيادية» وهذا يعني أن درجات الحرارة هذه كانت أعلى 
من متوسط درجات الحرارة خلال أشهر الفقرة من 1901 إلى 2000؛ 
| ولإيجاد ذلك يجب Lule‏ أولاً ترتيب درجات الحرارة من أقل قيمةء إلى أعلى 
| قيمة ثم إيجاد ال )10( درجات من أسفل القائمة كما يلي: 
.Sort temp |‏ 
.list in -10/1 |‏ 


year month temp 





1575. 
1576. 
1577. 
1578. 
1579. 


1580. 
1581. 
1582. 
1583. 
1584. 





لاحظ أهمية التفرقة بين )1( (رقم casts‏ أو أول مشاهدة) وحرف )1( 
: (حرف إل أو آخر مشاهدة) في الأمر أعلاه. 
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المحدد in‏ يمكن استخدامه بنفس الطريقة مع أغلب أوامر تحليل وتحرير 
البيانات» ودائما يشير إلى البيانات كما تم ترتيبها في آخر LÍ oo yo‏ المحدد if‏ 
فله العديد من التطبيقات» ولكنه يختار المشاهدات ely‏ على قيم متغير plane‏ 
فمثلاً لعرض المتوسط الحسابي والانحراف المعياري لدرجة الحرارة غير 
الاعتيادية قبل سنة 1970 نقوم بطباعة الأمر التالي: 
.summarize temp if year« 1970‏ 
Variable Obs Mean Std. Dev. Min Max‏ 
temp 1080 -.1232613 .1829313 -.7316 . 4643‏ 
ولتلخيص درجات الحرارة في السنوات الأخيرة نقوم بطباعة الأمر: 
summarize temp if year»- 1970‏ . 
Variable Obs Mean Std. Dev. Min Max‏ 
remp 504 .3159532 .2300395 -.2586 . 8422‏ 
علامة " (أقل من)() وعلامة  -"‏ (أكبر من أو تساوي) هي علامات 
متعلقة بالأوامر: 


x‏ يساوي 

={ لاتساوي (-- تقوم بنفس المهمة) 
1 أكبر من 

7 أصغر من 

X‏ أكبر من أو تساوي 

<= 


أصغر من أو تساوي 
Lay‏ أن علامتي يساوي "==" تشيران إلى الاختبار المنطقي "هل القيمة 
في الطرف الأيسر تساوي القيمة التي في الطرف الأيمن؟'. بالنسبة لبرنامج 
ستاتاء فإن علامة يساوي واحدة تعني شيئاً آخر مختلفا وهو: "إجعل القيمة 


() لاحظ أن اتجاه علامتي أكبر من وأصغر من خاصة باللغة الإنجايزيء وذلك لان 
جميع أوامر ستاتا باللغة الإنجليزيةء GY‏ هذه العلامة سوف يكون اتجاهها في الجهة 
المعاكسة في حالة اللغة العربية. 
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التي في الطرف الأيسر مساوية للقيمة التي في الطرف "al‏ علامة = 
ا علامة متعلقة بالا واو ل يمك استخدامها مع محدد cif‏ وذلك 
لأن علامة = واحدة لها معان أخرىء فعلامة = واحدة تظهر في تطبيقات 
محددة مثل الأوزان واختبار الفرضيات. 

استخدام علامة أو أكثر متعلقة بالأوامر يمكن أن يتم مع محدد if‏ واحدء 
وذلك باستخدام العلامات المنطقية» والعلامات المنطقية في ستاتا هي: 

d's علامة‎ © 

or'J علامة‎ | 

(000 تقوم بنفس المهمة)‎ ~) notos علامة‎ C 

الأقواس تسمح لنا بتحديد أسبقية العمليات» فلعرض ملخص درجات 
الحرارة غير الاعتيادية لشهري يناير وفبراير للسنوات من 1940 إلى 
9 نقوم باستخدام الأمر التالي: 


.summarize temp if(month == 1 | month == 2) 
&year>=1940 &year«1970 


ملاحظة مهمة بشأن البيانات المفقودة: ستاتا سوف يعرض البيانات 
المفقودة كفترة» ولكن في بعض العمليات (بشكل ملحوظ ifs sort‏ بالرغم من 
أنها ليست عمليات إحصائية مثل المتوسط الحسابي أو الارتباط)» هي نفس 
القيم المفقودة والتي تعامل معاملة أكبر قيم موجبةء فمثلا بافتراض أننا نريد 
تحليل بيانات استطلاعات الرأيء الأمر التالي سوف يقوم بعمل جدول 
اتتخاب للمشاركين الذين أعمارهم 65 سنة وأكبرء وكذلك المشاركين الذين 
أعمار هم عبارة عن قيم مفقودة: 
.tabulate vote if age>= 65‏ 
ولكن عند وجود ad‏ مفقودة: فإننا نحتاج إلى التعامل معها بشكل أكثر 
eres‏ من خلال استخدام محدد US if‏ يلي:” 
Imissing (age)‏ ع 65 -tabulate vote if age>=‏ 
خيار عدم عرض القيم المفقودة» ) Imissing(‏ يعتبر طريقة عامة 
لاختيار المشاهدات مع عدم عرض القيم المفقودة» بالرغم من Gd‏ اس تخدمنا 
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حتى الآن الرمز الافتراضي للقيم المفقودة وهو "." إلا أن ستاتا يمكنه 
استخدام أكثر من 27 je)‏ لهذه القيم؛ فاستخدام Lay if !missing (age)‏ 
يضع Lila‏ القيم المفقودة. وللحصول على معلومات أكثر عن القيم المفقودة: 
قم باستخدام الأمر .help missing‏ 

هناك طرق مختلفة لاستبعاد القيم المفقودة من العرضء فدالة (missing)‏ 
تقوم بعرض )1( إذا كانت القيمة مفقودة و(0) إذا لم تكن bay tie‏ فمثلاً 
لوضع جدول الانتخاب للمشاهدات التي ليس لها قيم مفقودة لمتغيرات العمر 
«age‏ الدخل income‏ و التعليم e$ education‏ بطباعة الأمر 


.tabulate vote if missing (age, income, 
education) == 


أخيراء وحيث إن القيمة المفقودة الافتراضية هي "." وستاتا يعتبرها أكبر 
قيمة» وهناك قيم مفقودة أخرى (سوف يتم شرحها لاحقا) تعتبر أكبرء يمكننا 
استخدام غلامة dl‏ .من أو علامة لايساوي ".>" لاستبعاد عرض القيم المفقودة 
كما يلي: 
.tabulate vote if age<. &income<. &Education<.‏ 
dE incl‏ كن Xe ia CA a a ean iat aal‏ 
عدم قدرة أمر معين على العمل» هذان المحددان ليس لهما أي تأثير على 
البيانات المخزنةء فالأمر أدناه سوف يطبق على كل المشاهدات مالم يتم 
استخدام in‏ أو df‏ ولحذف متغيرات ف البيانات» قم باستخدام الأمر drop‏ 
jl)‏ استخدم نافذة محرر البيانات «(Data Editor‏ عودة إلى ملف بيانات كندا 
(Canadal.dta)‏ يمكننا حذف المتغيرات mlife‏ والمتغير flife‏ من البيانات 
بطباعة الأمر. 
.drop mlife flife‏ 
يمكن استخدام كل من in‏ أو if‏ لتحديد المشاهدات التي يراد حذفهاء 
فمثلاً 12/13 drop in‏ يعني قم بحذف المشاهدات 12 و13 في البيانات؛ كما 
يمكننا كذلك حذف_مشاهدات محددة أو متغيرات محددة بالضغط على زر 
ell Delete‏ استخدام نافذة محرر البيانات .Data Editor‏ 
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بدلا من حذف مشاهدات أو متغيرات في ملف بيانات ستاتاء يمكننا 
us‏ أن نقوم بتحديد ما نريد clay)‏ عليه؛ Yu Sud‏ من استخدام أمر drop‏ 
للمتغير mlife‏ و المتغير flife‏ من ملف Canadal.dia‏ يمكن القيام بنفس 
المهمة باستخدام الأمر ckeep‏ وكتابة المتغيرات الثلاثة الأخرى كما يلى: 

.keep place pop unemp 

متل الكثير من التغييرات التي يتم القيام بها في برنامج ستاتاء فإن كل 
تغيير لن يتم الإبقاء عليه في ملف البيانات ما لم نقم بحفظ ذلك التغيير» عند 
هذه النقطة سوف يكون لدينا الخيار (replace « save)‏ وبذلك تتم التغييرات 
في الملف الحالي» كما يمكن حفظ البيانات في ملف جديد باختيار. < File‏ 
Save As‏ أو بطباعة الأمر save newname‏ ويكون لديك بجهازك ملفان 
اثنان للبيانات. 
clu‏ واستبدال Generating and Replacing Variables : Olysib\‏ 

أمر الإنشاء generate‏ والاستبدال replace‏ يتيح لنا إنشاء متغيرات 
جديدة» أو تغيير قيم المتغيرات الحالية؛ فمثلا في أغلب المجتمعات الصناعية 
بكنداء هناك احتمال أن تكون النساء أطول عمراً من الرجال؛ ولتحليل التغير 
في أعمار الجنسين نقوم بفتح ملف «Canadal.dta‏ وإنشاء متغير جديد 
يساوي الفرق بين العمر المتوقع للإناث flife‏ والعمر المتوقع للذكور smlife‏ 


وعند استخدام الأمر generate‏ أو replace‏ سوف نقوم باستخدام علامة 











يساوى واحدة. 

.use C:\data\Canadal, clear 
generate gap = flife - mlife 
.label variable gap “Female-male life 
expectancy gap" 
.describe gap 

i storage display value 
variable name type format label variable label 
gap float 59.09 Female-male life expectancy gap 


.list place flife mlife gap 





66 الإحصاء مع برنامج ستاتا 


place flife miife 


Canada 
Newfoundland : z .900002 
Prince Edward Island l4 z 5.5 
Nova Scotia 3 "m. .200005 
New Brunswick " 5 .799995 


Quebec . 5 .699997 
Ontario lvl 75.5 5.599998 
Manitoba P 8 .800003 
Saskatchewan 1 , . 600006 
Alberta 5 5.900002 


British Columbia s E .599998 
Yukon E , . 099998 
Northwest Territories 5 . 800002 





بالنسبة لولاية Newfoundland‏ فإن القيمة الصحيحة ل gap‏ يفترض أن 
تكون 79.8 - 73.9 = 5.9 سنةء ولكن Yay‏ من ذلك فإن جدول المخرجات 
أعلاه يعرض القيمة 5.900002 وذلك GY‏ ستاتا مله مثشل كل برامج 
الحاسب يقوم بتخزين الأرقام بنظام ثنائي: والقيمة 5.9 ليس لها تعبير ثنائي. 
عدم الدقة البسيطة نتيجة التقريب في النظام الثنائي ليس لها تأثير على النتائج 
الإحصائيةء ولكنها قد تثير الانتباه في قائمة البيانات؛ ويمكننا تغيير تتسيق 
العرض بحيث يعرض ستاتا L‏ مقربة. فالأمر التالي يجعل تنسيق العرض 
ثابتاً بحيث يكون عرض العمود كافيا لعرض أربعة أرقام وبعد الفاصلة يتم 
عرض رقم واحد فقط. 
.format gap %4.1£‏ 
حتى عند عرض القيمة 5.9 بالأمر أعلاهء فإن الأمر التالي لن يستطيع 
عرض هذه القيمة عند طلبها تلك القيمة مباشرة. 
.list if gap == 5.9‏ 
هذا يحدث GY‏ ستاتا يعتقد بأن القيمة Y‏ تساوي بالضبط 5.9 (تقنيا ستاتا 
يخزن gap ad‏ بشكل مفرد كما هي» ولكن كل العمليات الحسابية تتم بالنظام 
الثنائي» وفي النظام المفرد والثنائي 9.5 لايمكن تحديدها بدقة). 
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تنسيقات العرض وتنسيقات أسماء المتغيرات والتوصيفات يمكن تغييرها 
Lal‏ وذلك بالنقر مرتين على أي عمود في نافذة محرر البيانات «Data Editor‏ 
حيث يمكن وضع تنسيقات رقمية ثابتة مثل %4.1۴ كأحد أكشر التنسيقات 
aad‏ تخد اما diy‏ كا عدة dey Can‏ مثها 





dg‏ تنسيق رقمي vale‏ حيث إن س يحدد العرض الكلى أو عدد 
الأعمدة التي سوف يتم عرضهاء ane JÉ dy‏ من الأرقام التي 
يجب أن تظهر بعد الفاصلة» أما بخصوص التعبيرات ALI‏ (مثل 
7 والتي تعني 107 1.00X‏ أو تعني 10 ملايين) سوف يتم 
استخدامها بشكل تلقائي عند الحاجةء وذلك لعرض القيم بأفضل 
شكل ممكن. E‏ ٍْ 

26.01 تنسيق رقمي ثابت. cus‏ إن س يحدد العرض الكلي أو عدد 
الأعمدة التي يتم عرضها و4 عدد ثابت من الأرقام التي يجب أن 
تظهر بعد الفاصلة العشرية. 

w.d‏ تنسيق رقمي تضاعدي» Cus‏ إن w‏ يحدد العرض الكلي أو عدد 
الأعمدة التي يتم عرضها وه عدد ذابت من الأرقام التي يجب أن 
تظهر بعد الفاصلة العشرية. 

فعلى سبيل المثالء إذا نظرنا إلى الجدول (1.2) فإن عدد سكان كندا كان 
0 تقريباء وكان عدد سكان إقليم يوكون Yukon‏ 30,100 تقريباء 
الجدول أدناه يعرض كيف تظهر هذه الأرقام باستخدام تنسيقات مختلفة. 


Yukon التنسيق كندا يوكون‎ 
30100 2.96e+07 %9.0g 
30100.0 29606100.0 %9.1f 


3.01000e+04 2.9606 1e+07 %12.5e 
بالرغم من أن الأرقام المعروضة تظهز بصور مختلفةء فإن قيمها‎ 
متطابقة تماماء وهذه التنسيقات لا تؤثر على العمليات الحسابية.. خيارات‎ 
المعروضة تتضمن استخدام الفواصلء والمحاذاة‎ ol SU التنسيق الأخرى‎ 
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لليمين واليسارء وكذلك axe‏ الأصفار التي تظهرء وهناك Ca jb‏ تنسيقات 
خاصة للتواريخ ولمتغيرات السلاسل الزمنية والمتغيرات النصية» وللحصول 
على معلومات ASÍ‏ حول التنسيقات قم بطباعة الأمر .help format‏ 
الأمر replace‏ يمكنه أن يقوم بنفس العمليات الحسابية التي يقوم بها 
generate‏ ولكنه يقوم بتغييرقيم المتغير الموجود بدلا من إنشاء متغير جديد. 
فعلى سبيل المتالء إذا افترضنا أنه لدينا بيانات الدخل Y sal‏ وقررنا أنه 
من الأفضل العمل مع هذه البيانات بحيث تكون بالآلافء وللقيام بعملية 
تحويل قيم الدولار إلى آلاف يمكننا التقسيم على 1000: 
.replace income = income/1000‏ 
الأمر replace‏ يمكنه القيام بمثل هذه التغييرات بالجملة:؛ أو يمكن 
استخدامه مع المحددات if y in‏ لتحرير بيانات معينة فقط بافتراض أن 
متغيرات المسح تتضمن العمر age‏ وسنة الميلاد born‏ فأمر ستاتا مثل الأمر 
أدناه سوف يقوم بتصحيح واحد أو ASÍ‏ من المتغيرات التي تم طباعتها 
بطريقة خاطقة Yas 299 fe‏ مض 29 
.replace age = 29 if age == 9‏ 
أو يمكن القيام بنفس الأمر بطريقة TES‏ بطباعة الأمر أدناه لتصحيح 
قيع العمر age‏ للمشاهدة رقم 1453 
.replace age = 29 in 1453‏ 
وللقيام بذلك هناك مثال أكثر تعقيدا. 


.replace age = 2012-born if missing(age)| 96+ 1 
> 2012-born 


الأمر أعلاه يستبدل قيم متغير العمر age‏ بقيمة 2012 مطروحا منها سنة 
الميلاد born‏ إذا كان العمر age‏ قيمة مفقودة أو إذا كان العمر المعروض (سنة 
الميلاد مضافا إليها 1) أقل من 2012 مطروحا منها سنة الميلاد. 

الأمر generate‏ 3 الأمر replace‏ يُعتبران أدو ات لإنشاء متغيرات 
تصنيفيّة» ad‏ لاحظنا سابقا أن البيانات الكندية تتشضمن عدة أنواع من 
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المشاهدات (حيث إنها تشمل إقليم ينو 10 ولايات ودولة واحدة) وبالرغم من 

أن المحددين if jin.‏ يسمحان Ul‏ بفصل هذه المشاهداتء فإن الأمر drop‏ 

يمكنه إزالة هذه المشاهدات من البيانات. وربما يعتبر أكثر الأمور سهولة هو 

وضع متغيرات تصنيفية توضح نوع المشاهدات؛المثال التالي يوضح طريقة 

إنشاء متل هذه المتغيرات باستخدام ملف بيانات كندا «Canadal.dta‏ ونبدأً 

بإنشاء المتغير type‏ كمتغير ثابت يساوي 1 لكل مشاهدة؛ ثم نقوم باستبدال 

هذه القيمة بالقيمة 2 لإقليم يوكون Yukon‏ والأقاليم الشمالية الغربية 

Northwest Territory‏ والقيمة 3 لكنداء والخطوات الأخيرة تتضمن توصيف 
المتغير الجديد pe‏ وتعريف التوصيفات للقيم 1ء 2ء 3. _ 

-use "C:\data\Canadal.dta", clear 

-generate type = 1 

.replace type = 2 if place == "Yukon" | 

place =="northwest Territories’ 

-replace type = 3 if place == "Canada 

-label variable type "Province, territory or 

nation’ 

-label define type1b1 1 "Province" 2 

"Territory" 3 "Nation 


-label 7311165 21 
list 
unemp mlife flife 
Canada . 5 , 3 Nation 


Newfoundland Z " i 1 Province 
Prince Edward Island 2 5 d 1 Province 


Nova Scotia B 3 : s Province 
. New Brunswick . 1 . . Province 


Quebec 5 5 ^ E Province 
Ontario f 9. 4 7 Province 
Manitoba U x 5 : Province 
Saskatchewan E : Province 
, Alberta 8. 5 Province 


British Columbia i 3 Province 


Yukon A 5 i: Territory 
Northwest Territories 3 5 Province 
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كما يظهر في الجدول السابق» فإن توصيف القيم لمتغير تصنيفي يتطلسب 
أمرين اثنين» فالأمر label define‏ يحدد ماهي التوصيفات التي ترافق «US A‏ 
والأمر label values‏ يحدد ما هو المتغير الذي تنطبق عليه Slime gill‏ إحدى 
مجموعة التوصيفات (والتي تم إنشاؤها بالأمر (Su (label define‏ تطبيقها على 
أي عدد من المتغيرات الرقمية (وذلك بإضافتها إلى الأمر (label values‏ 
توصيفات القيم يمكن أن تتضمن 32000 حرف» ولكن من الأفضل ألا تكون 
توصيفات المتغيرات طويلة جدا. 

الأمر generate‏ يمكنه إنشاء متغيرات جديدة» والأمر a Su replace‏ 
القيام بتخفيض القيم باستخدام أي خليط من المتغيرات القديمة والثوابت والقيم 
العشوائية والتعبيرات» بالنسبة للمتغيرات الرقمية يجب أن GALS‏ عليها 
الإشارات الحسابية التالية: | 


gem 
cob. - 
ضرب‎ * 
الأس‎ ^ 


الأقواس سوف تتحكم في ترتيب العمليات الحسابية» وبدون اس تخدام 
الأقواس» فإنه سوف يتم اتباع الترتيب المعتاد للعمليات الحسابية» وبالنسبة 
للعلامات الحسابيةء فإن العلامة الوحيدة التي يتم استخدامها مع المتغيرات 
النصية هي علامة الجمع "+" حيث إنها تقوم بدمج متغيرين نصيين في متغير 
واحد. 

وبالرغم من اختلاف أغراض استخدام الأمر generate‏ والأمر replace‏ 
فإنهما متشابهان من حيث التركيبةء حيث إنهما يستخدمان نفس المعاملات 
الحسابية والمنطقية التي يستخدمها ستاتاء كما أنهما يستخدمان المحددين هذ أو 
cif‏ كما أن هذه الأوامر يمكنها استخدام مجموعة من الدوال الخاصة ببرنامج 
cs‏ وال ,سويت ريثم شرحها clin‏ 
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الأمثلة التي تم شرحها حتى الآن» تتضمن a)‏ 15 واحدا فقط للقيم 
المفقودة. والقيمة المفقودة يعتبرها ستاتا أعلى قيمة عند ترتيب القيم من أقفل 
قيمة إلى أكبر قيمة. وبصفة عامة» فإن وجود القيم المفقودة في بعض 
البيانات ترجع لأسباب عدة؛ ويمكننا استخدام عدة أنواع من الرموز لتمثشل 
القيم المفقودة» وذلك بإضافة امتداد لرموز القيم المفقودة» وهذه القيم المفقودة 
بامتداد سوف يعتبرها ستاتا قيما كبيرة عند ترتيب البيانات من أعلى قيمة إلى 
أقل قيمة» فمثلا سوف يتم ترتيب القيم المفقودة من ”ه.“ إلى ”2.“ كما أن 
رموز القيم المفقودة بامتداد يمكن أن تتم إضافة توصيف لها على عكس 
الرمز الافتراضي للقيمة المفقودة ”.“ والذي لايمكن إضافة توصيف له. 

تظهر الحاجة إلى استخدام أنواع مختلفة من رموز القيم المفقودة فسي 
الدراسات الاستقصائية عند استخدام استمارة الاستبيان. فمثلا قد لا نجد إجابة 
لسؤال "في أي سنة تزوجت؟' وذلك GY‏ أحد أفراد العينة لم يسبق له الزواج؛ ولا 
يمكنك أن تتجاهل الإجابات الخاصة بهذا السؤال؛ مستخدما ملف البيانات 
Gills Granite2011_6.dta‏ يحتوي على بيانات من دراسة استقصائية حول 
وجهات النظر السياسية بولاية نيوهامبشير والذي قام به مركز.جرانيت لاستطلاع 
الرأي في جامعة هامبشير بالولايات المتحدةء ففي أحد أسئلة الاستطلاع؛ تم سؤال 
أفراد العينة عن مستوى اهتمامهم بالانتخابات العامة لسنة 2012 (genint)‏ 
وسوف نستخدم هذا السؤال لشرح رموز القيم المفقودة بامتداد. 

في البداية يظهر أن مستوى الاهتمام genint‏ واضح» ولكن من الصعب 
القيام ببعض التحليلات الإحضائية مع هذا السؤال: 

-tabulate genint 


Interest in 2012 
pres. election 









extremely interested 245 47.48 47.48 
very interested 168 32.56 80.04 
Somewhat interested 72 13.95 93.99 
not very interested 28 5.43 99.42 
don't know 2 0.39 99.81 


no answer 
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يظهر من الجدول أعلاه أن القيم الأربع الأولى تمثل مقياس الاهتمام: 
وتم توصيفها من "مهتم للغاية" “extremely interested"‏ إلى "غير مهتم "not "ss:‏ 
LÍ every interested"‏ آخر قيمتين فهما "لا أعرف" Y" y "don't know"‏ إجابة" sno‏ 
answer"‏ وهاتان الإجابتان لايمثلان جزءًا من مقياس الاهتمام» وإنما هما نوع 
من عدم الإجابة. مركز جرانيت لاستطلاع الرأي يستخدم LS‏ خاصة في 
الدراسات الاستقصائية لتمثل عدة أنواع من غدم الإجابة. وفي مثالنا هذاء فإن 
الرقم 98 يعني أن المشارك في الدراسة قد أجاب ail‏ لايعلم مستوى اهتمامه؛ 
في حينء أن الرقم 99 يعني لا إجابة تم إعطاؤها للسؤال؛ ويمكننا أن نرى هذه 
القيم الرقمية إذا قمنا باستخراج نفس الجدول أعلاه بدون توصيف القيم. 


.-tabulate genint, 1 


Interest in 
2012 pres. 
election Freq. Percent Cum. 





أي حسابات إحصائية للمتغير 4 لن تكون دقيقة» وذلك بسبب 5 352 
الرقمين 8 و99 Wiad‏ لمعرفة المتوسط الحسابي للمؤهلات العلمية لأفراد 
العينة للمتغير cgenint‏ فإن ذلك سوف يكون عديم النفع» وذلك GY‏ القيمتين 
8 و99 تم تضمينهما في حساب المتوسط الحسابي. 


«tabulate educ, summarize (genint) 








Highest Summary of Interest in 2012 pres. 
degree election 
completed Mean Std. Dev. Freq. 







HS or les 2.8275862 B.9668722 
Tech/some 3.5 12.451587 120 
College g 1.672956 .82290667 159 


Postgrad 1.5775862 







.80380467 





2.3424658 7.4366697 
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TEM NISL RENE 
والشكل الجديد للجدول سوف يكون مختلفا‎ cgenint2 نسميها المتغير الجديد‎ 
عن السابق» وذلك لثلاثة أسباب هى:‎ 





أولا: سوف نعكس القيم من 1 إلى 4 بحيث إن القيم الأعلى تشير إلى اهتمام 
أكبر بدلا من اهتمام «il‏ وهذا يجعل عملية التفسير منطقية أكثر. 
-generate genint2 = 5 - genint if genint«90‏ 

ثانياً: القيم 98 و99 يُفترض اعتبارها Lad‏ مفقودةء ولن يتم تضمينها في 
حساب المتوسط الحسابيء والحسابات الإحصائية c AY)‏ لذلك سوف 
نستخدم رمز القيمة المفقودة a‏ لتمثل "لا أعرف" "don't know"‏ والتي 
تم تمثيلها سابقا بالرمز 98 والرمز 6. لتمثل Y"‏ إجابة" “no answer"‏ 


.99 والتي تم تمثيلها سابقا بالرمز‎ 
.replace genint2 = .a if genint == 8 
‘replace genint2 = .b if genint == 99 


ثالثا: توصيف القيم يمكن اختصاره بجمل قصيرة:؛ Ya‏ من استخدام مهتم 
للغاية" “extremely interested”‏ إلى رقمء وبذلك فإن التوصيف سوف 
يأخذ حيّزًا أقل في الرسوم البيانية والجداول. 
label variable genint2 "interest in 2012‏ 
election (new)"‏ 
-label define genint2 1 "Not very" 2 "Soriewhat"‏ 
"Very"‏ 3 
"Extremely" .a "DK" .b "NA'‏ 4 
label values genint2genint2‏ 


الخطوة الأخيرة المهمة» وهي استخراج جدول للمتغيرات الجديدة 
والمتغيرات القديمة للمقارنة بينهما والتأكد من أن جميع الأوامر قد قامت بما 

هو مُفترض. 
-tabulate genint genint2, miss‏ 
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Interest in 2012 Interest in 2012 election (new) 
pres. election Not very Somewhat Very Extremely Total 
extremely interested 245 
very interested 168 
somewhat interested 72 
not very interested 28 
don't know 2 
no answer 1 
Total 28 72 168 245 516 


Interest in 2012 
election (new) 
DK 






Interest in 2012 













NA 





pres. election 








extremely interested 
very interested 













somewhat interested 72 
not very interested 28 
don't know 2 





no answer 


بعد إجراء هذه التعديلات» فإن هذا المتغير أصبح SU‏ للتحليل بشكل 
أكثر وضوحاً من ذي «ad‏ فمثلاً أصبح من السهل أن نحدد المتوسط الحسابي 
لمستوى الاهتمام بالانتخابات مع تحديد المستوى التعليمي لأفراد العينة. 


. tabulate educ, summ(genint2) 







Highest Summary of Interest in 2012 
degree election (new) 
completed Mean Std. Dev. Freq. 









HS or les 3 .98229949 115 
Tech/some 3.1101695 .89427331 118 
College g 3.327044 .82290667 159 





3.4224138 





Postgrad .80380467 







3.2244094 .88647221 508 


عند التعامل مع أرقام Ju) forme‏ 98 و 99 في المثال أعلاه) ily‏ 
ts‏ إلى القيم المفقودة» فإنه من الأفضل تغيير رموز القيم المفقودة بالطريقة 
Ais id‏ حتى لا يقوم ستاتا بإدخالها ضمن أي حسابات giles)‏ يمكن 
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بسهولة القيام بذلك لجميع المتغيرات» وذلك باستخدام الأمر mvdecode‏ فمتلا 
يمكن إعطاء الأمر. 
.mvdecode genintincomeage, mv (97=.\98=.a \99=.b)‏ 
الأمر أعلاه سوف يغير أي es‏ للمتغيرات age «income sgenint‏ من 
7 إلى ”.“ ومن 98 إلى “a”‏ وهكذاء القيم من 2. و b‏ (حتى القيمة 2.) adi‏ 
مفقودة يمكن إدخال توصيف لهاء ولكن لايمكن إدخال توصيف لرمز القيمة 
المفقودة ”.“. وكما هو معتادء فإن هذه التعديلات التي تم القيام بها لاتصبح 
دائمة حتى يتم حفظ البيانات» ومن الأفضل حفظها في ملف باسم جديد 
كإجراء احتياطي» فربما قد نحتاج إلى العودة إلى البيانات الأصلية مستقبلا 
لأي سبب من الأسباب. 


Using Functions : استخدام الدوال‎ 


هذا الجزء يعرض قائمة بالعديد من الدوال المتوافرة للاستخدام مع الأمر 
generate‏ والأمر creplace‏ فعلى سبيل المثال» يمكننا إنشاء متغير جديد 
باسم doginc‏ وهو يساوي اللوغاريتم الطبيعي للمتغير income‏ وذلك 
باستخدام Alla‏ اللوغاريتم الطبيعي 1١‏ مع الأمر generate‏ كما يلي: 
generate loginc = ln(income)‏ 
In Alla‏ هي واحدة من الدوال الرياضية في برنامج ستاتاء الأمثلة 
الأخرى تتضمن logl0(x)‏ للوغاريتم طبيعي أساسه 10ء int(x)‏ للعدد 
الصحيح exp(x) o‏ وهي عبارة عن + مرفوعة للأس e) x‏ تساوي تقرييا 
8 وهناك العديد من الدوال الأخرى. وللحصول على قائمة 
كاملة بتفاصيل هذه الدوالء قم بطباعة الأمر «heip math functions‏ 
وهناك أيضًا العديد من دوال الكثافة الاحتماليةء ويمكنك الحصول على 
قائمة كاملة بهذه الدوال بطباعة الأمر help density functions‏ أو من خلال 
الاطلاع على دليل المستخدم لبرنامج ستاتاء حيث تحتوي قوائم هذه الدوال 
على تعريفات لهذه الدوال» وتركيب معاملاتهاء وكيفية تعاملها مع القيم 
المفقودة. فعلى سبيل المثال» invnormal(p) Alla‏ تعطي التوزيع الطبيعي 
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المعياري التراكمي أو قيمة z‏ المرتبطة بدرجة الاحتمال «p‏ وتتضمن الدوال 
الأخرى قيمة بيتاء والتوزيع الثنائي» ومربع كاي» واختبار » واختبار CF‏ 
وتوزيع جاماء والتوزيعات المنتظمةء وهناك Alla‏ أخرى مهمة lan‏ خاصة 
بالمحاكاة وهي runiform()‏ وتستخدم لإنشاء الأرقام شبه العشوائية وذالك 
لاستخراج القيم من التوزيعات المنتظمةء وهذه القيم نظرياً تكون في نطاق 
بين 0 و1 تقريباً وتكتب على الشكل (0,1]. 
برنامج ستاتا يعرض العديد من دوال التواريخ» وكذلك التواريخ التي 
تتعلق بدوال السلاسل الزمنية» وخاصة تلك التي لها تنسيقات خاصة في 
العرض أو المتغيرات التي تتعلق بالتواريخ؛ ويمكن الحصول على قائمة 
بتفاصيل تلك الدوال من دليل المستخدم الخاص ببرنامج ستاتا أو بطباعة 
الأمر thelp date functions‏ دوال التاريخ في العادة تتضمن تواريخ 
ماضية» والتي تشير إلى عدد الأيام منذ 1 يناير 1960م. 
بيانات درجة الحرارة العالميةء والتي تم الإشارة إليها سابقاً في هذا 
الفصل» تعتبر كمثال للتواريخ الماضيةء حيث يحتوي ملف البيانات على 
بيانات السنة year‏ والشهر month‏ ولكن لا يوجد متغير واحد يتضمن بيانات 
الشهر والسنة معا كمقياس للزمن. 
-use C:\data\globall.dta, clear‏ 
-describe‏ 


Contains data from C:\daca\globall.dta 


ops: 1,584 Global climate 

vars: 3 4 Jul 2012 11:21 

size: 11.088 

storage display value 

variabie name type format label variable label 
year int *8.0g Year 
month byte +8.0g Month 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, C 
Sorted by: 


يمكننا إنشاء متغير Xa‏ للتاريخ الماضي يسمى edate‏ باستخدام دالة 
mdy‏ وهي عبارة عن اختصار للحروف الأولى للكلمات شهر ويوم 
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وسنة (month, day, year)‏ تم احتساب متوسط الحرارة الشهري لبيانات 
درجات الحرارة العالمية في المثال eÍ‏ لذلك فمن الممكن استخدام اليوم 
5 من كل شهر (المدخل البديل هو استخدام بيانات شهرية - انظر إلى 
شرح بيانات الملف Climate.dta‏ في الفصل 12) وحيث إن ae Qus edate‏ 
الأيام منذ 1 يناير 1960ء لذا فإن عدد الأيام قبل هذا التاريخ سوف تظهر 
بإشارة سالبة. 








.generate edate = mdy(month, 15, year) 
.label variable edate "elapsed date’ 
list in 1/5 


year month temp edate 


-.0623 -29205 
-.1929  -29174 


-.1966 -29145 
-.0912 -29114 
-.151 -29084 


Unos o£ M م‎ 





ويمكن أن تكون النتيجة أكثر وضوحاً إذا قمنا بتنسيق بيانات المتغير edate‏ 
كمتغير يمثل تاريخ (%td)‏ يعرض الشهر (m)‏ والقرن (C)‏ والسنة (Y)‏ ثم e‏ 
بتوصيف القيم الرقمية للمتغير edate‏ ونعطيها وصف "1880 “Jan‏ 


-Lormat edate %tdmCY 
-list in 1/5 
year month temp. 


Jan1880 
Feb1880 


Mar1880 
Apr1880 
May1880 


بر رح س لحر ال 





< أخيراً نقوم بحفظ البيانات save‏ مع المتغير الجديدء وبإنشاء رسم بياني 
لدرجة حرارة العالم السنوية temp‏ مع المتغير edate‏ يمكننا الحصول على 
فكرة عن التغير خلال الفترة الزمنية. 


‘sort yearmonth 
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.Order year month edate 
-save C:\data\glbal12.dta, replace 
-graph twoway line temp edate 


5 1 


0 


NCDC global temp anomaly vs 1901-2000, C 
-5 


1 





Jan1880 Jan1900 Jan1920 Jan1940 Jan1960 Jan1980 Jan2000 Jan2020 
. elapsed date 


الشكل )1.2( 


الأنواع الأخرى من الدوال تتضمن دوال المصفوفاتء ودوال الأرقام 
العشوائيةء ودوال النصوص: ودوال السلاسل الزمنيةء ودوال البرمجة؛ قم 
بطباعة الأمر help‏ متبوعاً بأي نوع من أنواع الدوال لمشاهدة تفاصيل كل 
نوع من أنواع cL) gal‏ كما يقوم دليل المستخدم لبرنامج ستاتا بعرض أمثلة 
أكثر تفصيلا عن هذه الدوال. 

دوال متعددة وعوامل أحرى يمكن استخدامها مع أي أمر حسب الحاجة» 
والدوال والعوامل الرياضية الأخرى التي سبق شرحها سابقا يمكن أيضنا 
استخدامها بطريقة أخرى بحيث لا تقوم بإنشاء أو تعديل أي متغيرات» الأمر 
display‏ يقوم بحساب وعرض النتائج على الشاشةء فمثلا: 


.display 2+3 
5 
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-display 10g10(10^83) 

83 

.display invttail(120, .025) * 34.1/sqrt(975) 
21 5 


لذا فإن الأمر display‏ يمكن استخدامه لعرص الحسابات الإحصائية على 
الشاشة على خلاف الأوامر replace y generate‏ والتي تقوم بإجراء تغييرات 
مباشرة في النتائج الإحصائية. ولتوضيح ذلكء نعود لبيانات الجليد في القطب 
الشمالي» والتي تم شرحها في الفصل الأول من هذا الكتاب cArctic9.dta‏ أحد 
المتغيرات extent‏ والذي fier‏ متوسط المنطقة المغطاة بالجليد بذ سبة %15 
على الأقل خلال شهر سبتمبر في كل سنة (تم إظهارها في رسم بباني بالشكل 
1.1(« فخلال 33 سنة من مشاهدات الأقمار الصناعيةء متوسط 'المنطقة 
المغطاة بالجليد كان نحو 6.52 مليون كيلومتر مربع. 
-summarize extent‏ 
Variable Obs Mean Std. Dev. Min Max‏ 


extent ^ 33 6.51697 9691796 4.3 7.88 


بعد الحصول على الملخض أغلاه»:فإق ستاتا يقو بحفظ la gill‏ 
الحسابي كمتغير كمي بأسم r(mean)‏ 


.display r(mean) 


6.5169697 

يمكننا استخدام هذه النتيجة لإنشاء متغير جديد Gis extentÜ aul‏ 

يُعرف بأنه الانحراف عن متوسط الذترة 1979 — 2011« extentü‏ سوف 

يكون له ننس الانحراف المعياري الخاص بالمتغير extent‏ ولكن المتوسط 

الحسابي له صفر تقريباء وهذا يعكس قيمة الانحراف عن المتوسط لكل شهر 
سبتمبر في كل سنة. | 

gen extent0 = extent - r (mean) 

‘Summ extent extent0 


Variable Obs Mean Std. Dev. Min Max 





extent 33 6.51697 .9691796 4.3 7.88 
extentO 33 1.17e-08 .9691796 -2.216969 1.36303 
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بعد القيام JS‏ عملية تحليل يقوم برنامج ستاتا بحفظ هذه النتائج مؤقتا 
من inca s‏ وتنك a camaro‏ لكين كانت EN Td oco‏ ات 
الإحصائية أو البرمجة اللاحقة» ولمشاهدة قائمة ALIS‏ بالأسماء والقيم التي تم 
حفظها قم بطباعة الأمر sreturn list‏ قفي المثال أعلاه القيم المخزنة r(N)‏ 
r(mean) 5 r(sum. w) 3‏ تمثل آخر القيم التي قام ستاتا بحفظها في ذاكرته المؤقتة 
للمتغير .extent‏ 


.return list 


scalars: 
r(N) = 33 
r(sum w) = 33 
r(mean) = 1.17403088194e-08 
r(Var) = .9393091848549505 
r(sd) = .9691796452954171 
r(min) = -2.21696949005127 
r(max) = 1.363030433654785 
r(sum) = 3.87430191040e-07 


برنامج ستاتا يوفر كذلك أوامر c‏ لإنشاء المتغيراتء› فالأمر egen‏ 
(وهو امتداد (generate OU‏ له مجموعة من الدوال التي تقوم بعدة مهام 
بطريقة أسرع وأسهل من الأمر «generate‏ وهذه المهام تتضمن إنشاء 
متغيرات جديدة من المجاميع» وأعلى قيمة» وأصغر Aad‏ ونطاق الربيعات؛ 
والقيم المعلمية والترتيبات أو المتوسطات المرجحة للمتغيرات. فعلى سبيل 
المثال» لإنشاء متغير جديد باسم zscore‏ والذي يساوي القيم المعلمية (متوسط 
0« انحراف 1) للمتغير × نعطي الأمر التالي: 
.egen zscore = std(x)‏ 
أو يمكن القيام بانشاء متغير جديد avg‏ وهو يساوي المتوسط الحسابي 
لصف قيم كل مشاهد: x, y, z, w‏ ويتجاهل أي قيم مفقودة. 
.egen avg - rowmean (x,y,z,w)‏ 
لإنشاء متغير جديد باسم rotal‏ يساوي مجموع قيم الصفوف لكل مشاهدة 
ل w‏ ,: ,بر x,‏ ويعتبر oil‏ المققودة صفر. 
.egen total = rowtotal (x, y, z, w) ^‏ 
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الأمر التالي يقوم بإنشاء متغير جديد يسمى oxrank‏ والذي يحتوي على 
ترتيب قيم المتغير x‏ علما بأن 1 = xrank‏ لأعلى Aad‏ في x‏ و 2 = xrank‏ 
لثاني أعلى Aad‏ وهكذا. 
.egen xrank - rank(x)‏ 
للحصول على قائمة بدوال الأمر egen‏ قم باستخدام help egen jay‏ أو 
قم بالبحث في دليل مستخدم برنامج متتاتا للحصول على أمثلة أكثر عن كيفية 
استخدام الدالة. 
النحويل بين التنسيقات الرقمية والنصية : 
Converting Between Numeric and String Formats‏ 
الملف Canada2.dta.‏ يحتوي على متغير نصي واحد يسمى «place‏ كما 
يحتوي على متغير تصنيفي وصفي ctype‏ وكلا المتغيرين يحتويان على قيم 


: . 


e 


.use C:\data\Canada2, clear 
.list place type 





























1. Canada Nation 
2. Newfoundland Province 
3% Prince Edward Island Province 
4. Nova Scotia Province 
5. New Brunswick Province 
6. Quebec Province 
da Ontario Province 
B. Manitoba Province 
9. Saskatchewan Province 
10. Alberta Province 
i1. British Columbia Province 
12; ; Yukon Territory 
13. Northwest Territories Territory 





تحت التوصيف يبقى المتغير ype‏ متغيرا Gal‏ ويظهر بخط أزرق في 
نافذة محرر البيانات Data Editor‏ أو نافذة Browser‏ وبالضغط على أي خلية 
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سوف نرى الأرقام» ويمكننا رؤية قائمة بهذه الأرقام باستخدام الأمر nolabel‏ 
us‏ يلي: 


.list place type, nolabel 


MAC 
iQ ut 






Nova scotia 
New Brunswick 


Quebec 
Ontario 













Manitoba 
Saskatchewan 
Alberta 






Tis British Columbia 
12. Yukon 
13. Northwest Territories 


المتغيرات النصية والرقمية التي لها توصيفات تسلك سلوكا مختلفاً عند 
التحليل. حيث إن أغلب العمليات الإحصائية والعلاقات الرياضية لايمكن 
استخدامها مع المتغيرات النصية» لذلك فإننا قد نحتاج إلى الحصول على 
نسخة نصية ورقمية بتوصيفات لبعض المعلومات في البيانات الموجودة 
لديناء الأمر encode‏ يقوم بإنشاء متغير رقمي بوصف من متغير نصيء 
الرقم 1 يتم إعطاؤه للحرف الأبجدي الأول للمتغير النصي ورقم 2 للحرف 
الأبجدي الثاني وهكذاء المثال التالي يقوم بإنشاء متغير رقمي وصفي يسمى 
من المتغير النصي place‏ كما يلي: 
.encode place, gen(placenum)‏ 
كما أنه من الممكن القيام بالتحويل العكسيء فالأمر decode‏ يقوم بإنشاء 
متغير نصي باستخدام قيم المتغير الرقمي» فمثلاً يمكننا إنشاء المتغير النصي 
typestr‏ من المتغير الرة قمي type‏ 
-decode type, gen(typestr) i‏ 
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وعند استخراج قائمة بالمتغيرات» فإن المتغير الرقمى الجديد 
7 ووالمتغير النصي الجديد typestr‏ يتشابهان مع المتغيرات 
الأصلية. 





.list place placenum type typestr 


placenum 
1. Canada Canada Nation Nation 
2 Newfoundland Newfoundland Province Province 
3. Prince Edward Island Prince Edward Island Province Province 
4. Nova Scotia Nova Scotia Province Province 
5. New Brunswick New Brunswick Province Province 
6 Quebec Quebec Province Province 
3 Ontario Ontario Province Province 
8. Manitoba Manitoba Province Province 
9 Saskatchewan Saskatchewan Province Province 
10 Alberta Alberta Province Province 
11. British Columbia British Columbia Province Province 
12. Yukon Yukon Territory Territory 
13. Northwest Territories Northwest Territories. Territory Territory 





ولكن عند استخدام خيار cnolabel‏ فإن الاختلافات تصبح أكثر وضوحا. 
حيث إن ستاتا يعتبر المتغير placenum‏ والمتغير type.‏ أرقاما. . 
.list place placenum type typestr, nolabel‏ 


place placenum type 


Ls Canada Nation 
2. Newfoundland Province 
3. Prince Edward Island Province 
4, Nova Scotia 8 Province 
5. New Brunswick Province 
6 Quebec Province 
7 Ontario Province 
8. Manitoba 4 Province 
9 Saskatchewan Province 
10 Alberta Province 
11. British Columbia Province 
12. Yukon Territory 


13. | Northwest Territories - Territory 
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أغلب التحليلات الإحصائية Jie‏ المتوسط الحسابيء والانحرافات 


المعيارية يمكن القيام بها مع المتغيرات الرقمية class‏ لذلك فإن توصيف هذه 
المتغيرات لايعتبر ذا أهمية أثناء إجراء الحسابات الإحصائية. 


-summarize place placenum type typestr 





Variable Obs Mean Std. Dev. Min Max 
place 0 
placenum 13 7 3.89444 1 13 
type 13 1.307692 .6304252 1 
typestr 0 


أحياناً قد نجد أن قيم أحد المتغيرات النصية في أغلبها أرقاماء ولتحويل 
هذه القيم النصية إلى نظيراتها الرقمية» يجب علينا استخدام دالة Wied «real‏ 
في البيانات أدناه» المتغير النصي siblings‏ يحتوي على قيمة نصية واحدة 4“ 
or more”‏ والتي RN Uglied (Sa)‏ برقم. 


-describe siblings 





storage display value 
variable name type format label variable label 
siblings str9 &9s 


Number of siblings (string) 


.list 


siblings 


on رم لما كر‎ HD 


4 or more 





‘generate sibnum = real(siblings) 


المتغير الجديد sibnum‏ أصيح الآن متغيرا رقميا مع قيمة مفقودة واحدة 
وهي or more”‏ 4م 
-list‏ 
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siblings sibnum 








WP لم س‎ HM 


الأمر destring‏ يوفر طريقة أكثر مرونة لتحويل المتغيرات النصية إلى 
متغيرات رقميةء ففي المثال أعلاهء يمكننا إجراء نفس calgall‏ وذلك بطباعة 
الأمر التالي: 
-destring siblings, generate(sibnum) force‏ 
للحصول على معلومات أكثر حول تركيبة هذا الأمر وخياراته» اطبع 
الأمر .help destring‏ 
chiul‏ متعيرات datio)‏ وترتبيية جديده : 


eee 


Creating New Categorical and Ordinal Variables 


في الجزء السابقء تم شرح كيفية إنشاء متغير تصنيفي uype‏ وذلك 
للتفرقة بين الأقاليم )3 PES‏ مقاطعات) (province and nation)‏ في ملف 
البيانات الكندية» ويمكننا أن نقوم بإنشاء متغيرات تصنيفية وترتيبية Goby‏ 
aye‏ هذا الجزء يعطي بعض الأمثلة عن ذلك. 
المتغير type‏ يحتوي على ثلاثة تصنيفات: 
‘tabulate type‏ 


Province, 






territory 
or nation 












Province 
Territory 
Nation 
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بافتراض أننا نريد إعادة كتابة المتغير type‏ ليكون Jue‏ $ عن تعبير 
ثنائي أو وهمي ممثل بالفيمتين 0 أو 1ء الأمر tabulate‏ سوف يقوم بإنشاء 
متغيرات وهمية بطريقة آلية إذا قمنا بإضافة generate JUS‏ إليه. في المثال 
التالي هناك نتائج لمجموعة من المتغيرات type3. stype2 sypel‏ وكل متغير 
al y las Play Leia‏ فن (ya clin XD‏ الم ctype‏ 


-cabulate type, generate (type) 


Province, 









territory 
or nation 


' Province 






Territory 2 15.38 92.31 


Nation 


-describe 


Contains data from c:\data\Canada2.dta 





obs: 13 Canadian dataset 2 

vars: 11 18 Apr 2013 19:57 

size: 741 

storage display value ^ 

variable name type format label variable label 
place str21 321s Place name 
pop float %9.0g Population in 1000s, 1995 
unemp float 59 و0.‎ % 15+ population unemployed, 1995 
mlife float %9.0g Male life expectancy years 
flife float %9.0g Female life expeccancy years 
type float %9.0g typelbl Province, territory or nation 
placenum long *21.0g placenum Place name 
cypestr scr9 595 Province, territory or nation 
typei byte 58 . و0‎ type==Province 
type2 byte &8.0g type==Territory 
type) byte 98 . و0‎ types=Nation 
Sorted by: 


Note: dataset has changed since last saved 


-list place type typel-type3 d 
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type typel type2 type 


Canada Nation 

Newfoundland Province 

Prince Edward Island Province 
°` Nova Scotia Province 

New Brunswick Province 


Quebec „Province 
Ontario Province 
Manitoba Province 
Saskatchewan Province 
Alberta Province 


British Columbia Province 


Yukon Territory 


Northwest Territories Territory 





AC اة كخم عة من اكرات ل‎ coca. اة‎ dsl 
لايتضمن فقداناً لأي معلومات. ففي المثال أعلاهء نجد أن المتغيرات من‎ 
توضح نفس المعلومات التي يوضحها المتغير‎ lea type? P إلى‎ typel 
نفسه» وأحياناً يختار المحللون إعادة كتابة المتغيرات القابلة للقياس في‎ type 
كبيرًا من المعلومات.‎ le ja شكل تصنيفي أو ترتيبي حتى عند فقد النتائج‎ 
يعطي قياسا‎ Canada2.dta في الملف‎ unemp فعلى سبيل المثال» المتغير‎ 
يتوق :يودي إلى أن بكرن معدل‎ callidi كندا من‎ ala giasl Ala لمعذل‎ 
.12.26 البطالة في المدى ما بين %7 5 9619.6 مع متوسط حسابي‎ 


‘Summarize unemp if type !=3 


Variable Obs Mean Std. Dev. Min Max 


unemp 10 12.26 4.44877 7 19.6 


عند هذه النقطة إدخال كندا ضمن التحليل يؤدي إلى عدم توافق البيانات» 
لذلك سوف نقوم باستبعادها بالأمر التالي: 0( 

-drop if type==3 | 

هناك نوعان من الأوامر يمكن استخدامهما لإنشاء متغير وهمي يسمى 

2 يساوي 0 إذا كان معدل البطالة أقل من المتوسط )12.26( ويساوي 
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1 إذا كان معدل البطالة أكبر من أو يساوي المتوسط. وقيمة مفقودة عند 
وجود أي قيمة مفقودة ضمن بيانات المتغير cunemp‏ أما الأمر الثاني فهو 
INTERES UPS:‏ الأمر يقوم باعتبار القيم المفقودة أعلى القيم 
الموجودة ضمن البيانات. 
-generate unemp2 = 0 if unemp« 12.26‏ 
(7missing values genereted)‏ 


replace unemp2 = 1 if unemp» 312.26 & 
!missing (unemp) 
(Sreal changes made) 


ربما نحتاج إلى وضع القيم ضمن مجموعات لتكون متغير قياس» وهذا 
يعني أنه يجب علينا القيام بإنشاء متغير تصنيفي أو ترتيبي. ويمكن القيام 
يسمى unemp3‏ والذي يصنف قيم المتغير unemp‏ ضمن ثلاث مجموعات 
متساوية العرض ويكون الفراغ بينها من 5 إلى 20 نقوم بطباعة الأمر: 
-generate unemp3 - autocode(unemp,3,5,20)‏ 
(2missing values generated)‏ 


يمكن إنشاء قائمة تعرض بيانات المتغير الوهمي الجديد (unemp2)‏ 
والمتغير الترتيبي (wnemp3)‏ والمتعلقة بقيم بمتغير القياس الأصلي .unemp‏ 


-list place unemp unemp2 unemp3 


place unemp unemp2 unemp3 


Newfoundland 

Prince Edward Island 
Nova Scotia 

New Brunswick 
Quebec 


Ontario 
Manitoba 
Saskatchewan 
Alberta 

British Columbia 


Yukon 
Northwest Territories 
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استخدام المخفضات الصرعة مع اطتغيرات : 


Using Explicit Subscripts with Variables 


٠‏ عندما تكون هناك بيانات في ذاكرة برتامج ستاتاء فإن هذه البيانات 
تستخدم لتعريف متغيرات نظامية محددة» وهذه المتغيرات. تقوم بوصف تلك 
البيانات؛ فمثلا N‏ تمثل مجموع axe‏ المشاهدات بينما n‏ تمثل عدد 
المشاهدات»ء Cus‏ إن n=]‏ للمشاهدة الأولىء n=2‏ للمشاهدة الثانية وهكذا 
حتى المشاهدة الأخيرة ( n= N‏ )» وإذا قمنا بطباعة الأمر أدناه فإنه يقوم 
بإنشاء متغير جديد يسمى caselD‏ وهو عبارة عن رقم كل مشاهدة كما هي 
في ترتيبها الحالي. 
-generate caseID = n‏ 
ترتيب البيانات هو طريقة لتغيير رقم قيمة كل مشاهدة n‏ ء ولكن قيمتها 
في المتغير الجديد caseID.‏ سوف تبقى بدون تغييرء لذلك إذا قمنا بترتيب 
البيانات بطريقة أخرىء فإنه يمكننا أن نعود إلى ترتيبها السابق بطباعة الأمر 
:Sort caseID‏ 
إنشاء وحفظ الأرقام غير المتكررة المحددة لكل مشاهدة والتي تقوم 
بترتيب المشاهدات فى مراحل مبكرة أثناء العمل على البيانات يمكن أن 
تساعد لاحقاً في إدارة هذه البيانات. 
يمكننا أن نستخدم المخفضات الصريحة مع أسماء المتغيرات لتحديد رقم 
مشاهدة معينة» فعلى سبيل call‏ لعرض المشاهدة الرابعة في بيانات 
درجات الحرارة العالمية global2 dta‏ والتي كانت في أبريل 1880 وكان 
الانحراف في درجة الحرارة °C‏ 0.0912- نقوم بطباعة الأمر: 


-display temp[4] 
-.0912 


وبالمثل. فإن remp[5]‏ تعرض المشاهدة الخامسة التي تمثل الانحراف 
في درجة الحرارة في مايو 1880 وهي °C‏ 151.- 


-display temp[5] 
-.15099999 
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المخفضضدات الصريحة. والمتغير النظامي Lg] n‏ علاقة خاصة عندما 
تكون البيانات متسلسلةء ففي مثال درجات الحرارة أعلاه بالنسبة للمتغير 
temp‏ فإن tempf n]‏ تشير إلى المشاهدة رقم nth‏ أما temp] n-1]‏ فإنه 
يشير إلى درجة الحرارة السابقة remp[ n*1]‏ يشير إلى درجة الحرارة 
اللاحقة؛ لذلك فإننا قد نحتاج إلى إنشاء متغير جديد باسم difiemp‏ وهو 
يساوي التغير في temp‏ منذ الشهر الماضي. 

.generate diftemp - temp - temp[ n-1] 

الفصل )12( سيدور حول تحليل السلاسل الزمنية» ويشرح بالتفصيل 
هذا الموضوع. 
اسثيراد olly‏ من برامخ أخرى : 


Importing Data from Other Programs 


الجزء السابق قام بشرح كيفية إدخال البيانات وتحريرها في نافذة محرر 
البيانات «Data. Editor‏ ولكن إذا كانت البيانات مخزنة ومنسقة في ملف 
جداول إلكترونيةء يمكننا فقط نسخ ولصق البيانات في محرر بيانات خالء أو 
يمكن لستاتا القيام باستيراد هذه البيانات من ملف إكسيل مباشرة من خلال 
القائمة كما يلي: 

File > Import > Excel spreadsheet (*.xls; *.xlsx) - 

أو يمكن استخدام الأمر import excel‏ وببساطة يمكننا استيراد الورقة 
الأو لى في ملف إكسيل المسمى snowfall.xls‏ بطباعة الأمر 
.import excel using C:\data\snowfall.xls, clear‏ 

ولكن الجداول الإلكترونية تحتوي على عناوين وملاحظات» وعناوين 
فرعية» وورقات متعددة» ورسومات بيانية» وخصائص أخرى تعقد عملية 
استيراد البيانات» ولتقييد عملية استيراد البيانات import‏ لنطاق خاص من 
الخلايا نقوم باستخدام الخيار cellrange()‏ كما أن الخيار sheet()‏ يمكنه 
تحديد الورقة التي تريد استيراد البيانات منها في ملف إكسيلء والخيار 
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firstrow‏ 2323 لبرنامج ستاتا أن خلايا الصف الأول تحتوي على أسماء 
المتغيرات» EC‏ في cabal‏ إكسيل snowfall.xls‏ الورقة الأولى اسمها 
“Berlin”‏ تحتوي على بيانات تاريخية عن سقوط الثلوج لقرية برلين Berlin‏ 
بولاية هامبشير بالولايات المتحدة والتي تم مناقشتها في بحث Hamilton et‏ 
al. (2003)‏ والبيانات موجودة في النطاق من الخلية AS‏ إلى الخلية 056( 
والعمود 4 يحتوي على أسماء المتغيرات. 


.import excel using C: NdataNsnowfall.xls, 


sheet("Berlin") 
cellrange(a4:056) firstrow clear 


بالرغم من أن خاصية استيراد بيانات إكسيل import excel‏ تعتبر دقيقة 
le y‏ ماء فإن alae]‏ البيانات وتنسيقها في ورقة إكسيل يجعل العملية أكشر 
سر dde‏ وسيل على clu ies que itas.‏ 3528 لا كان هناك يمن 
أسماء المتغيرات في ورقة إكسيل يجب أن تقابل معايير ستاتاء وهذه المعايير 
مثلا يجب أن تبدأ بحرف أو شرطة تحتيّة " _ " ويجب ألا د ole os yin‏ 
فراغاتء Lal‏ القيم المفقودة فيجب أن يتم استبدالها بفراغات أو رموز رقمية, 
والحروف النصية يجب حذفها من الخلايا بالأعمدة وتمثيلها بمتغيرات رقمية. 

يقوم ستاتا بشكل تلقائي کید cals WY Le‏ اتات كل aae‏ عل مرا 
رقمياً أو نصياًء وإذا كانت هناك قيم غير رقمية في أي عمودء فإن ستاتا 
سوف يعتبر ذلك العمود يحتوي على بيانات متغير نصي»ء وهذا يعني أن 
الحسابات الإحصائية مثل المتوسط الحسابيء والارتباط لن تكون ممكنة مع 
هذا المتغير النصي» وإذا كانت أغلب القيم هي قيم And)‏ فيمكننا إنشاء 


متغير رقمي جديد (وجعل قيمه النصية كرموز للقيم cn‏ باستخدام دالة 
real()‏ 


«generate newvar = real(oldvar) 

وبالمثل› فإننا قد نحتاج إلى القيام بهذه العملية عند نسخ ولصق بيانات في 
محر ر البيانات Data Editor‏ وقبل اختيار البيانات ol yall‏ نسخهاء فإننا قد نحتاج 
إلى تحرير ملف إكسيل الذي يحتوي على هذه البيانات. إحدى الطرق السهلة 
للقيام بذلك هي إدراج صف لأسماء المتغيرات في أعلى البيانات بملف إكسيل 
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ثم نسخة البيانات» بما في ذلك صف أسماء المتغيرات واستخدام لصق خاص 
Paste Special‏ مع خيار معاملة الصف الأول كأسماء للمتغيرات Treat first‏ 
tow as variable names‏ وذلك لوضع كل البيانات في محرر بيانات خال. 


يقة ملف إكسيل ومحرر البيانات Data Editor‏ هى طريقة سهلة 
وسريعة ولكن بالنسبة للبيانات الكبيرة فإنه من الضروري أن تكون هذه 
البيانات محفوظة بواسطة gl y‏ إحصائية أخرى مثل ملفات SAS‏ أو SPSS‏ 
أو SAS XPORT‏ والتي يمكن استيراد بياناتها من خلال اختيارات قائمة ستاتا 
File < Import < 585 XPORT‏ 
أو باستخدام الأمر «import sasxport‏ كما أن clus‏ البيانات الأخرى 
يمكن قراءتها باستخدام ملفات نصية وسيطة أو ترجمتها مباشرة باس تخدام 
برامج خاصة. 
بالإمكان شرح طريقة الملفات النصية باستخدام السلاسل الزمنية للمناخء 
فالتردد الجنوبي إلنينيو (سوف يتم اختصارها (ENSO‏ مي ظاهرة مناخية 
شبه دورية تحدث في المنطقة الاستوائية بالمحيط الهادئ» ولكنها أيضا تؤثر 
على المناطق الأخرىء ويتم تفسير أجواء المنطقة الاستوائية بالمحيط الهادئ 
من خلال مؤشر ENSO‏ المتعدد والذي يتضمن ستة متغيرات (الضغط على 
مستوى البحرء رياح السطح الجنوبية والإقليمية» سطح البحر ودرجة حرارة 
هواء سطح البحرء والسحاب) يتم دمجها في مؤشر واحد ل .ENSO‏ الملف 
النصي MELraw‏ يحتوي على قيم شهرية لمؤشر ENSO‏ للفترة من يناير 
1950( وحتى ديسمبر .]201 وهذه القيم تم فصلها باس تخدام مفتاح «tab‏ 
وفاصلة لملف نصي تمت كتابته بواسطة أحد برامج الجداول Aig SST‏ 
الصف الأول من النص يحتوي على قائمة بأسماء المتغيرات وهي: meil‏ 
لقيمة المؤشر خلال شهر يناير» mei2‏ لقيمة المؤشر خلال شهر فبراير وهكذا 
(في الواقع فإن قيمة المؤشر لشهر يناير تمثل ديسمبر - ينايرء وقيمة المؤشر 
لشهر فبراير تمثل يناير - فبواير وهكذا) الصفوف الأولى من الملف النصي 
تظهر كما يلي: uie‏ 
B “Lage dde dag Cow lan Die "Lar Pee "os Ci CUIR iy,‏ 
 -1.068 -1.194 -1.216 -.44 -.264 482 756 864 79 .752 7B 467‏ 1951 


1952 406 .M2 095 60 29 ..63 1.235 1.157 .39 311 1.338 1.1235 
1953 .04 388 22 .2 .83 .M? 42 .232 2 9 .4» n 
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يمكننا قراءة هذه البيانات باستخدام ستاتا عن طريق الأمر insheet‏ مع 
خيارات لتحديد أن القيم تم فصلها باستخدام مفتاح tab‏ وأن الصف الأول يحتوي 
على أسماء المتغيرات. وبعد قراءة بيانات الصفوف» يمكننا حفظ الملف بتنسيق 

ستاتاء وسوف نقوم بتسميته METO.dia‏ وسوف نستخدم هذا الملف لاحقاً. 
.insheet using c:\data\MEI .raw, tab name clear‏ 
.Save c: NdataMMEIO.dta, replace‏ 


describe 
Contains data from c:\data\MEIO.dta 
obs: 62 
vars: 13 29 Apr 2013 17:01 
size: 3,100 
storage display value 
variable name type format label variable label 
year int %8.00 
meil float %9.0g 
mei2 float %9.0g 
mei3 float %9.0g 
mei4 float %9.0g 
meid float %9.0g 
mei6 float %9.0g 
mei? float %9.0g 
mei8 float %9.0g 
mei9 float %9.0g 
meilO float %9.0g 
meiii float $9.0g 
meil2 float %9.0g 
Sorted by: 


بإضافة الخيار ya comma‏ من E insheet y tab‏ قراءة ملف نصي 
يحتوي على كنم PAUL TURON AO‏ النوع من الملفات النصية هو الصيغة 
le gut ASSI‏ لمخرجات الجداول الإليكترونيةء ويمكن sel ji | Leal‏ الملفات 
النصية باستخدام قوائم برنامج ستاتاء ولمشاهدة الخيارات المتوافرة قم باختيار 
.Data > Import‏ 
حتى الآن الأمثلة التي تم شرحها افترضت أن قيم .البيانات تم فصلها عن 
بعضها بفواصل أو مفتاح tab‏ أو محددات معلومة أخرى (والتي يمكن أن يتم 
استخدامها مع الفواصل ومفتاح «(tab‏ هناك إجراء آخر مختلف Gib)‏ عليه 








54 الإحصاء مع برنامج ستاتا 





تنسيق العمود الثابت fixed-column format‏ حيث تكون البيانات غير 
مفصولة بعلامات معينةء ولكنها تقع في مواقع أعمدة محددة مسبقاء ومثل هذا 
النوع من الملفات يمكن قراءته باستخدام الأمر dnfix‏ حيث يجب علينا أولاً 
تحديد كيفية قراءة الأعمدة. 


فعلى سبيل المثالء لدينا بيانات مخزنة بملف نصي من نوع (ASCII)‏ 
تحت اسم nfresour.raw‏ 


198624087641691000 
198725247430001044 
198825138637481086 
198925358964371140 
1990 8615731195 
1991 7930001262 


البيانات أعلاه تتعلق بإنتاج a jl gall‏ الطبيعية في نيوفوندلاند بكنداء 
المتغيرات الأربعة تقع في مواقع أعمدة ثابتةء فالأعمدة من )1 — 4( Jia‏ 
السنة )1986 .. 1991( الأعمدة من 5 — 8 حجم إنتاج الغابات بالمتر 
المكعب بالآلاف )2408 ... قيمة (ba giia‏ الأعمدة من 9 - 14 حجم إنتاج 
المناجم بالدولار بالآلاف )764,169 .. 793,000( LÍ‏ الأعمدة من 15 - 
8 فإنها مؤشر أسعار المستهلكين» ففي سنة 1986 كان المؤشر 1000 وفي 
ài‏ 1991 كانت قيمة المؤشر 1262ء يجب ملاحظة أن الفراغات في 
تنسيق الأعمدة السابقة تعني وجود قيم مفقودة» كما أن البيانات لاتحتوي على 
أي فواصل عشرية. ولاستيراد بيانات nfresour.raw‏ داخل برنامج ستاتا يجب 
علينا تحديد موقع عمود كل متغير كما يلي: 

-infix year 1-4 wood 5-8 mines 9-14 CPI 15-18 


using "C:\Data\nfresour.raw", clear 
.list 


year wood mines CPI 


764169 1000 
743000 1044 
B63748 1086 


896437 1140 
861573 1 5 


Nn Pw N م‎ 


6. : 793000 1262 
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التنسيقات الأكثر تعقيدا من الأعمدة الثابثةء قد تتطلب قاموس بيانات» 
وقواميس البيانات يمكن أن تكون واضحة وصريحة وبها العديد من 
الاختيارات» ولمعرفة المزيد من المعلومات عن هذه الخيارات» قم بطباعة 
الأمر chelp import‏ ولمزيد من الأمثلة والشرح يمكنك الرجوع إلى دليل 
مستخدم برنامج ستاتا؛ ويمكن لبرنامج ستاتا أيضا استيراد بيانات من قواعد 
البيانات ODBC‏ وللحصول على معلومات أكثر عن ذلك» قم بطباعة الأمر 
-help odbc‏ 


ولكن ماذا إذا US‏ نريد بيانات من برنامج ستاتا لاستخدامها في برامج 
أخرى؟ يمكن القيام بذلك عن طريق الأمر Sian excel‏ والأمر export‏ 
sasxport‏ كما أن قوائم ستاتا توفر العديد من الاختيارات وذلك من خلال 
File > Export > Excel spreadsheet (*.xls; *.xlsx)‏ 
File » Export » SAS XPORT‏ 
الأوامر أعلاهء» سوف تقوم بإنشاء ملفات إكسيل أو ملفات SAS‏ 
087 كما يمكن أيضاً إنشاء ملفات نصية بتنسيقات مختلفة عن طريق 
الأمر outsheet‏ والأمر outfile‏ (أو من خلال القائمة (Data > Export‏ 
الخيار الآخر الأكثر سرعة هو نسخ البيانات من نافذة محرر البيانحات 
Data Editor‏ أو نافذة متصفح البيانات Data Browser‏ ببرنامج ستاتا ولصقها 
مباشرة في برنامج الجداول الإليكترونية مثل برنامج إكسيلء وفي الغالب فإن 
أفضل خيار هو نقل البيانات مباشرة بين الملفات المخزنة ببرامج إحصائية أو 
قواعد بيانات متخصصة:؛ وهناك بعض البرامج الأخرى التي قد تقوم بتحويل 
البيانات إلى صيغ مفهومة للبرامج الإحصائية» فمثلا برنامج ستاتا ترانسفير 
Stata Transfer‏ .تقوم بتحويل البيانات إلى تنسيقات مختلفة منها dBASE,‏ 
Excel, FoxPro, Gauss, JMP, MATLAB, Minitab, OSIRIS, Paradox,R,‏ 


S-Plus, SAS, SPSS, SYSTAT, Stata‏ حتى قواعد البيانات الكبيرة التي 
٠‏ تحتوي على كمية ضخمة من البيانات يمكن تحويلها بسرعة مع 
cStata/Transfer‏ وهذا البرنامج متوافر من شر StataCorp “tl 4S‏ 
(www.stata.com)‏ أو من خلال صانع البرنامج وهو Circle Systems‏ 
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«(www.stattransfer.com)‏ وبر امج تحويل البيانات ضرورية عند العمل مع 
عدة برامج لتبادل البيانات مع الآخرين. 
إحدى المميزات المهمة لبرنامج ستاتاء والتي يجب الإشارة إليها هي أن 
أي ملفات يتم حفظها ببرنامج ستاتا في أنظمة التشغيل المختلفة (سواء كانت 
5 أو Mac‏ أو (Unix‏ فإنه بالإمكان فتحها ببرنامج ستاتا بدون 
الحاجة إلى تحويلها لتلائم نظام تشغيل معين» ولتحويل ملف بيانات تم حفظه 
بإصدار سابق من برنامج ستاتا إلى أحدث إصدارات ستاتا يجب استخدام 
الأمر saveold‏ بدلا من استخدام الأمر save‏ أو استخدام قوائم ستاتا واختيار 
File » Save As < Save as type < Stata 9/10 Data‏ 
two‏ ملفين Ulun‏ أو Combining Two or More Stata Files : yl‏ 


بشكل vale‏ يمكننا دمج ملفات ستاتا بطريقتين: إرفاق append‏ ملف 
البيانات الثاني» والذي يحتوي على المشاهدات الإضافية أو دمجه merge‏ مع 
الملف الذي يحتوي على المتغيرات 3 القيم الجديدة B VM‏ الملف lakewinl.dta‏ 
يحتوي على بيانات عن بداية ذوبان الجليد في أكبر بحيرة (بحيرة 


وينيبسوكي) بولاية هامبشير GLY gb‏ المتحدة وهذه البيانات تم تسجيلها 
بواسطة المواطنين القاطنين لمدة 1 سنة في فترة ت تمتد من 1887 TEM‏ 
use c:\data\lakewinl.dta, clear‏ . 
-describe‏ 
Contains data from c:\data\lakewinl.dta‏ 

obs: 121 Lake Winnipesaukee ice-out 1887-2007 
vars: 3 2 Jul 2012 06:11 

size: 726 

Storage display value 

variable name type format label variable label 
year int tty Year 
winedate * int &$tdCYmd Lake Winnipesaukee Ice-Out 
winout int $9.0g Lake Winnipesaukee Ice-Out day 


Sorted by: year e 
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rM MEL B‏ ا ا 


.list in -4/1 


year winedate winout 
118. 2004Apr20 
119. 2005Apr20 
120. ; 2006Apr3 
121. 2007Apr23 





من الجدول cel‏ نجد أنه في سنة 2007 بدأ ذوبان الجليد في البحيرة 
في 23 أبريلء وهو اليوم 113 من السنة. 

الملف slakewin2.dta‏ يحتوي على بيانات جديدة للفترة ما بين 2008 
إلى 2012( وهو يحتوي على نفس المتغيرات بنفس التنسيق» لذا يمكننا دمج 
وتحديث الملف Jakewin2.dta‏ مع البيانات الجديدة الموجودة في الملف 
111.2 باستخدام الأمر append‏ كما يلي: 


-use c:\data\lakewin2.dta 
(Lake Winnipesaukee ice-out 2008-2012) 
-describe 


Contains data from c:\data\lakewin2.dta 


obs: 5 Lake Winnipesaukee ice-out 2008-2012 
vars: 3 2 Jul 2012 06:11 
size: 30 
storage display value 
variable name type format label variable label 
year int Sty Year 
winedate int $tdcymd Lake Winnipesaukee Ice-Out 
winout int $9.0g Lake Winnipesaukee Ice-Out day 





Sorted by: year 


.list 


year: winedate winout 


2008Apr23 
2009Apr12 
2010Mar24 
2011Apr19 
2012Mar23 


ثم زم س op‏ 
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-append using c:\data\lakewinl 

.Sort year 

.label data "Lake Winnipesaukee ice out 1887- 
2012" 

.Save c:\data\lakewin3 

.list in -7/1 


year winedate winout 


120. 2006 2006Apr3 
121. 2007 2007Apr23 
122. 2008 2008Apr23 
123. 2009 2009Apr12 
124. | 2010 2010Mar24 


125. 2011 2011Apr19 
126. 2012 2012Mar23 





في هذا المثال البيانات في الملفين الاثنين لها نفس المتغيرات بالرغم من 
أنه ليس من الضروري للأمر append‏ أن يحتوي الملفين على نفس 
المتغيرات» فإذا وجدت هناك متغيرات في ملف واحد ولم توجد في الملف 
gi «35‏ الديانات المضاف Gall‏ سوت تن البوانات غر ]$353.34 l—aj‏ 
مفقودة عند إجراء عملية الإرفاق. l‏ 


الأمر append‏ : يشبه إلى حد ما ورقة طويلة تحتوي على بيانات تم 
إلصاق ورقة أخرى في أسفلها تحتوي على بيانات جديدة» وبذلك يزيد طول 
الورقة. وهذا يعني إضافة مشاهدات جديدة للمتغيراتء أما الأمر دمج 
merge‏ ففى أبسط أشكاله يشبه إضافة ورقة جديدة على يمين الورقة الجديدة 
ويزيد عرض الورقة» وهذا يعني إضافة متغيرات جديدة للبيانات. 

الملف Jakesun.dta‏ : يحتوي على بيانات ذوبان الجليد لثاني أكبر 
بحيرة - بحيرة سنابى - بولاية نيوهامبشير خلال الفترة من 1869 إلى 
2012« وبالرغم ds‏ أن بيانات أكبر بحيرة «(lakewin3.dta)‏ وبيانات ثاني 
أكبر بحيرة (lakesun.dta)‏ تم الحصول عليهما من مصادر مختلفة فإنهما 
يمثلان سلسلة بيانات سنوية يمكن بسهولة دمجهما في ملف بيانات واحد» 
وذلك باستخدام merge 1:1 year Ay!‏ 
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.use csNdataMLakesun.dta 


. 
-describe 

Contains data from c:\data\lakesun.dta 

obs: 144 Lake Sunapee ice-out 1869-2012 
vars: 3 2 Jul 2012 06:11 
size: 1,152 
storage display value 

variable name type format label variable label 

year int باع‎ Year 

sunedate float %tdCymd Date Lake Sunapee Ice-Out 
sunout int $9.0g Lake Sunapee Ice-Out day 


Sorted by: year 


merge 1:1 year using c:\data\lakewin3.dta 


Result # of obs. 
not matched 18 
from master 218 (_merge==1) 
from using 0 ( merge--2) 
matched 126 -{_merge==3) 


كلا ملفي البيانات تم ترتيبهما حسب السنةء وإذا لم يكن هذا هو الوضع 
فيجب علينا أن نقوم بالترتيب حسب السنة sort year‏ قبل إجراء عملية 
الدمج» نتائج الدمج توضح أن هناك 126 سنة في كلا الملفين (يجب ملاحظة 
أن البيانات الموجودة في ذاكرة ستاتا الآن هي بيانات الملف الرئيس 
2160 والبيانات المستخدمة في عملية الدمج كانت من الملف 
المصدر Jakewin3.dta‏ وهناك 18 سنة إضافية )1869 إلى 1886( فقط 
موجودة في الملف dakesun. dta.‏ لذلك فإن متغيرات بحيرة وينيبسوكي (أكبر 
بحيرة) سوف تحتوي على قيم مفقودة لهذه السنوات» ويقوم الأمر merge‏ 
بإنشاء متغير اسمه merge‏ وهو يسجل ما إذا كانت المشاهدات تم الحصول 
.عليها من الملف الرئيس فقط merge-1)‏ ).» أو أن البيانات تم الحصول عليها 
من الملف المصدر merge=2)‏ ). أو أن البياناث من كلا الملفين 
merge-3)‏ (« وهناك خطوة مهمة lan‏ وهي معاينة القيم المدمجة ومراجعتها 
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بعناية بعد كل عملية دمج» وذلك للتأكيد على أن كل شيء تم حسب ما هو 
مخطط؛ وقبل القيام بعملية دمج أخرى يجب استبعاد drop‏ أو إعادة تسمية 
rename‏ المتغير الجديد merge‏ وذلك كما يلي: 

-drop merge 


.Sort year 
.list in 1/4 


sunedate sunout winedate winout 


1869 1869May9 


1870 1870May9 
1871 1871Aprll 
1872 1872May2 


ثم رح € Aa‏ 





.list in -4/1 


year sunedate sunout winedate winout 
141. 2009Apr11 2009Apr12 
142. 2010Apr3 2010Mar24 
143. 2011Apr21. 2011Apr19 
144. 2012Mar22 2012Mar23 





label data "Sunapee & Winnipesaukee ice out 
1869-2012' 


-Save c:\data\lakesunwin.dta, replace 
لإضافة متغيرات جديدة‎ merge باستخدام الأمر‎ lid في هذا المثال‎ 
وبشكل افتراضي فإنه‎ ear وذلك بمقارنة المشاهدات مع السنة‎ bl” 
فإن البيانات الموجودة في الملف‎ sly عند وجود نفس المتغيرات في ملفي‎ 
الرئيس تبقى كما هي» ويتم إهمال البيانات الموجودة في الملف المصدر.‎ 
والتي يمكن أن تعذل‎ merge وهناك عدة خيارات يمكن استخدامها مع الأمر‎ 
يسمح باس تبدال أي‎ coli الوضع الافتراضي عند دمج البيانات» فمثلاً الأمر‎ 
قيمة مفقودة في الملف الرئيس بأي قيمة موجودة في الملف المصدر (ملف‎ 
-(newdata.dta 44.4 البيانات هنا‎ 
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.merge 1:1 year using newdata.dta, update / 

أو يمكن استخدام أمر آخر يقوم باستبدال أي قيمة في الملف الرئيس بأي 
قيمة غير مفقودة في الملف المصدر»› وذلك إذا كانت قيم cs Lll‏ المصدر 
مختلفة عن قيم الملف الرئيس. 

emerge 1:1 year using newdata, update replace 

كل هذه الأمثلة توضح كيفية دمج ملف مع ملف آخر (1 إلى 1(« ولكن 
هناك احتمالية لدمج ملف بعدة ملفات أخرى (1 إلى مجموعة) وذلك باستخدام 
الخيار dm‏ أو دمج عدة ملفات بعدة ملفات أخرى بالخيار 5:. ولمزيد 
من المعلومات والأمثلة عن الدمج» قم بطباعة الأمر help merge‏ وانظر 
دليل إدارة البيانات «Data Management Manual‏ كما يمكن القيام بتعديل 
البيانات من خلال قوائم Ua‏ باختيار Data > Combine datasets‏ 


Collapsing Data : البيانات‎ (b 


بعد الحضون على cleat Sy bball‏ قد تكنشف لاحقا أن هذه البياتات 
لاتلائم احتياجاتناء أو أن هذه البيانات تحتوي على أخطاءء لحسن الحظ هناك 
العديد من الأوامر التي تسهل عملية إعادة بناء البيانات كما يجب» أسهل 
طريقة للقيام بذلك هي طي البيانات Cus collapse‏ يتم تجميع البيانات في 
مجموعات يتم تعريفها بالمتوسط الحسابي أو الوسيط أو أي مقياس إحصائي 
t AI‏ ولتوضيح ذلك نقوم بالعودة إلى بيانات درجات الحرارة العالمية 
الشهرية في الفترة ما بين يناير 1880 إلى ديسمبر 2011 بالملف 

.)1.2( والتي تم توضيحها بالرسم البياني رقم‎ global2.dta 
-use c:\data\global2.dta, clear 








: 
-describe 
Contains data from ¢:\data\global2.dta 
_, obs: 1,584 Global climate 
vars: 4 4 Jul 2012 11:21 
size: 14,256 
Storage display vaiue 
variable name type format label variable label 
year int $8.0g Year 
month byte &8.0g Month 
edate int %tdmcy elapsed date 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, c 


et se ce ra ee eR 


Sorted by: edate 
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باستخدام الأمر collapse‏ يمكننا بناء مجموعة بيانات بسيطة تضهن متوسط 
انحراف درجات الحرارة لفترة 2 سنة بدلا من 1584 شهز | ocn‏ 

-collapse (mean) temp, by(year) 

.label variable temp "NCDC annual mean temp 


anomaly, deg C' 
-save c:\data\global_yearly.dta, replace 
-describe 


Contains data from c:\data\global_yearly.dta 
obs: 132 Global climate 


vars: 2 30 Apr 2013 15:09 
size: 792 
storage display value 
variable name type format label variable label 
year int $8.0g Year 
temp float %9.0g NCDC annual mean temp anomaly, deg C 


Sorted by: year 


البيانات الجديدة يمكن توضيحها برسم بياني مضلع يشير إلى انحراف 
درجات الحرارة السنوية أعلى 3 di‏ من د الفترة من 1901 
إلى 2000. 


yn 


1880 1900 1920 1940 1960 1980 2000 
Year i 


(2.2) الشكل‎ ae 


6 


4 


2 


0 





-2 





NCDC annual mean temp anomaly, deg C 


-4 
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الأمر collapse‏ يمكنه إنشاء متغيرات طبقاً للحسابات الإحصائية التالية: 


ff^‏ المتوسط الحسابي (وهو الخيار الافتراضي إذا لم يتم تحديد أي شيء آخر). 
median‏ الوسيط 

pl‏ المئين الأول 

p2‏ المئين الثاني 

sd‏ الانحراف المعياري 


(sd/sqrt(n)) الخطأ المعياري للمتوسط الحسابي‎ semean 
(sqrt(p(I-p)/n)) المعياري للمتوسط الحسابيء ذي الحدين‎ (aj sebinomi 


a 
(sqrt(mean)) () su الخطأ المعياري للمتوسط الحسابي» بو‎ Sepaisso 
المجاميع‎ sum 


 rawsum‏ المجاميع مع تجاهل ad‏ استثنائية يتم تحديدها 

count‏ عدد المشاهدات الموجودة Wad‏ باستثناء القيم المفقودة 

Max‏ أعلى قيمة 

Min‏ أقل قيمة 

Iqr‏ المدى الربيعي 

exul Jý First 

Last‏ آخر القيم 

Firstnm‏ قيمة أول مشاهدة موجودة (يتم استثناء القيم المفقودة). 

Lastnum‏ قيمة آخر مشاهدة موجودة (يتم استثناء القيم المفقودة). 

هناك عدد كبير من الحسابات الإحصائية يمكن إجراؤها باستخدام أمر 
أكثر مرونة وهو الأمر statsby‏ وتتم كتابته قبل كتابة الحسابات الإحصائية 
المطلوبة. فعلى سبيل المثال» وباستخدام بيانات الملف global2.dta‏ نقوم بإنشاء 
متغير جديد يسمى decade‏ وهو يساوي 1880 للسنوات من 1889-1880 
و1890 للسنوات 1899-1890 وهكذاء بعد ذلك نقوم بإنشاء ملف بيانات آخر 
بلخصض الإحصائيات المهمة لدرجات الحرارة خلال عقد من الزمن. 
-use C:\data\global2.dta, clear‏ 


-gen decade = 10*int(year/10) 
-sStatsby, by(decade) clear:summarize temp 
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ee 
(cunning summarize on estimation sample) 
command: summarize temp 
N: r(N) 
sum w: r(sum_w) 
mean: r(mean) 
Var: r(Var) 
sd: xr(sd) 
min: r(min) 
max: r(í(max) 


sum: risum) 
by: decade 


—pL 1 —+— 2 —+ — 3 t 1*—_ > 


البيانات الأخيرة تتضمن عدد المشاهدات» والمتوسط الحسابيء والتباينء 
وأعلى قيمة» وملخص بإحصائيات أخرى لكل عقد من العقود الزمنية في 
البيانات» الشكل (3.2) يعرض Gu)‏ بيانياً بأعلى انحراف لدرجة الحرارة 

الشهرية لكل عقد (باستثناء عقد 2010 لأنه يتضمن سنتين فقط). 
-describe‏ 


Contains data 








obs: 14 statsby: summarize 
vars: 9 

size: 504 

storage display value 

variable name type format label variable label 
decade float %9.0g 
N float %9.0g r(N) 
sum w float %9.0g r(sum w) 
mean float %9.0g r (mean) 
Var float 59 . و0‎ r(Var) 
sd float %9.0g r(sd) 
min float %9.0g xr (min) 
max float %9.0g r (max) 
sum float %9.0g r(sum) 
Sorted by: 


Note: dataset has changed since last saved 


-graph bar max if year«2010, over(decade) 
ytitle("Maximum global temperature anomaly; C") 
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الشكل )3.2( 


الأمر statsby‏ يمكنه Laf‏ إنشاء بيانات من نتائج معادلات الارتباط أو 
أي تحليلات cg yah‏ لمزيد من التفاصيل والأمثلة عن هذا الأمرء قم بطباعة 
chelp statsby‏ كما أن دليل مرجع إدارة البيانات Data Management‏ 
Reference Manual‏ يعر ض معلومات عن هذا الأمر. 

مستخدماً قوائم ستاتا قم بالاختيار التالي: 

Statistics > Other > Collect statistics for a command across a by list 

سوف فتح نافذة لهذا الأمرء وهناك أمر مفيد آخر وهو contract‏ الذي 
التي يتم تحديدها (انظر (help contract‏ 
oslel‏ تشكيل البيانات : Reshaping Data‏ 

هناك عدة طرق مختلفة يمكن القيام بها لإعادة تشكيل البيانات باستخدام 
الأمر creshape‏ هذا الأمر có‏ البيانات بطرق بسيطة بين ترتيب طولي 
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وترتيب عرضي. ففي جزء سابق من هذا الفصلء قمنا بإنشاء ملف يحتوي 
على بيانات عن مؤشر ENSO‏ المتعدد «MEIO.dta)‏ حيث إن البيانات فى 
تنسيق عريض: السنوات تظهر في صفوفء ولكن كل شهر فى عمود 
منفصل» حيث إن العمود meil‏ يمثل قيمة المؤشر في شهر يناير» mei2‏ يمثل 
قيمة المؤشر في شهر فبراير وهكذا. 
-use C:\data\MEIO.dta, clear‏ 
describe‏ 


Concains data from c:\data\MEIO.dta 








obs: 62 . 
vars: 13 29 Apr 2013 17:51 
size: 3,100 
storage display value 
variable name type format label variable label 
سبحا‎ A À 
year int $8.0g 
meil float %9.0g 
mei2 float %9.0g 
mei3 float %9.0g 
mei4 float %9.0g 
mei5 float %9.0g 
nei 6 float %9.0g - 
mei? float %9.0g ` 
mei8 float %9.0g 
mei9 float %9.0g 
meild float %9.0g 
meill float %9.0g 
meil2 float %9.0g 5 
Sorted by: 


.list year-mei7 in 1/5 


we Ww tkt! 
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يمكننا إعادة تشكيل هذا التنسيق العريض للبيانات وجعلها سلسلة زمنية 
في تنسيق طوليء فالأمر أدناه يقوم بإنشاء متغير جديد باسم emei‏ وكل صف 
في البيانات الجديدة ذات التنسيق الطويل سوف يحتوي على محدد لكل 
مشاهدة i(year)‏ و مدد لكل مشاهدة (month) Le A‏ : 


.reshape long mei, i(year) j(month) 
(notes. = 1 2 3.4 5 6 7 8 9 10 11 12) 





Data wide -< long 
Number of obs. 62 -» 744 
Number of variables 13 -> 3 
j variable (12 values) -> month 


xij variables: 


meil mei2 ... 2 -> mei 





.compress 
.sort year month 


.label variable mei "Multivariate ENSO Index' 
.save C:\data\meil.dta, replace 


.đescribe 

Contains data from c:\data\meil.dta 

obs: 744 
vars: 3 30 Apr 2013 19:44 
size: 5,208 
storage display value 

variable name type format label variable label 
year int $8.0g 
month byte $9.0g 
mei float %9.0g 


Multivariate ENSO Index 


Sorted by: year month 


.list in 1/5 


year month 


بر زم نيا Uu‏ 
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أصبح لدينا الآن سلسلة زمنية لمؤشر ENSO‏ المتعدد على شكل 
سنوي/ شهري مشابه للسلسلة الزمنية الخاصة بدرجات الحرارة العالمية التي 
تم حفظها في ملف 0 سابقاً في هذا الفصل» مع وجود بيانات كلا 
الملفين مرتبة حسب السنة والشهرء يمكننا دمج الملفين في ملف واحد كما 


-use c:\data\global2.dta, clear 
‘merge 1:1 year month using C:\data\meil.dta 


Result # of obs. 
not matched 840 
from master 840 ( merge--1) 
from using 0 ( merge--2) 
matched 744 (_merge==3) 





بيانات درجات الحرارة في الملف global2.dta‏ تغطي كل شهر للفقرة 
ما بين يناير 1880 وحتى ديسمبر 2011 بينما البيانات بالملف meil.dta‏ 
تغطي فقط الفترة من يناير 1950 إلى ديسمبر 2011 وبالتالي لدينا 
840-120 45 موجودة فقط في الملف الرئيسء» وهي لا تتطابق مع 
باقي البيانات» وهي عبارة عن 744762X12‏ 5 موجودة في كلا الملفين 
وهي متطابقة. 

Sa ES SOB exl ural) Cabal lily dais as; 
خلال السنوات‎ mei بيانياً للمدة الزمنية يوضح درجات الحرارة مع المتغير‎ 
mei من 1950 وحتى 2011 هذان المتغيران لهما قياسات مختلفة» فالمتغير‎ 
يشير إلى المحور العمودي‎ gh yy سوف يكون على الجانب الأيمن لمحور‎ 
ise أدناه يقوم بإنشاء رسم بياني يتضمن منحنيين»‎ graph 2ء الأمر‎ 
وهي المدة. وتم رسم المنحنى الثاني‎ mei لدرجة الحرارة والآخر للمتغير‎ 
كما أن الأمر يحدد أيضًا مربع شرح الرسم البياني بصفين بدلا‎ sahii بخط‎ 
من الوضع الافتراضي وهو عمودان. النظرة الأولى للرسم البياني تشير إلى‎ 


cs a gi‏ الحرآر العالمية ومؤشر ENSO‏ في الغالب يتغيران معا من سنة 
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«s pa‏ وکن موشن GIS ENSO‏ أك Glad‏ من $us cia yo‏ كلق 

العقود الأخيرة. الفصل )12( يتعامل مع مثل هذا النوع من نماذج السلاسل 
الزمنية بطريقة أكثر دقة. 

.sort year month 

.drop merge 

-compress 1 

.save C:\data\global3.dta, replace 

.graph twoway line temp edate || 


line mei edate, yaxis(2) lpattern(dash) || 
if year>1949, legend(row(2)) 


o. : 

e 

S 

e 

o NX 

o 3 

2 

Su = 

=> -0 

w eo 

E zZ 

o ul 

5 E) 
o 

5o 2 

aay = 

E: 3 

8 TE 

9 

o 

Q 

e e 

Ow 

are 





Janí950 Jani960 Jani970 Jan1980 Jan1990 Jan2000 Jan2010 
elapsed date 





NCDC globa! temp anomaly vs 1901-2000, C 
E E Multivariate ENSO Index 


الشكل )4.2( 

الأمر agi treshapre‏ بنفس العمل عند استخدامه بطريقة عكسية لتغيير 
البيانات من التنسيق الطولي إلى التنسيق العرضيء حيث يمكنن ا تغيير 
السلسلة الزمنية للشهر والسنة الخاصة ls yas‏ الحرارة ومؤشر ENSO‏ 
. لتكون في وضع عرضيء بحيث يكون كل صف cas Fray‏ وکل عمود يمثل 

yg‏ وذلك باستخدام الأوامر التالية: 
.-drop edate‏ 
-reshape wide mei temp, i(year).j(month)‏ 
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استخدام الأوزان : Using Weights‏ 


يمكن لبرنامج ستاتا قبول أربعة أنواع من الأوزان: 

4 الأوزان التحليلية والتي تستخدم في ارتباط الربيعات الأقل وزنا والتحليلات 
المشابهة الأخرى. 

fweight‏ الأوزان التكرارية وتقوم بعد الأرقام المتكررة في المشاهدات. والأوزان 
التكرارية يجب أن تكون رقما صحيحا. 

iweight‏ الأوزان المهمة ويتم تعريفها حسب رغبة المستخدم. 

pweight‏ الأوزان الاحتمالية أو أوزان المعاينة وهي الجزء TEN‏ من احتمال أن 
مشاهدة ما تم إدراجها بسبب استراتيجية المعاينة. 


كل الأوزان ليست معروفة لكل أنواع التحليلات؛ فلا يمكننا مثلا 
استخدام pweight‏ مع الأمر ‘tabulate‏ الاستخدام الفعال للأوزان يتطلب ها 
كاملا لما هو مطلوب من هذه الأوزان القيام به في أي تحليل. 

للأوزان تطبيقات إحصائية عديدة منها طرق تعويض الأشياء غير 
المكاسية: Cleared y‏ النغارية dac Gaal)‏ وي al A als $a‏ انات 
الاستقصائيةء والوزن pweight‏ يوفر ái jh‏ لتعديل التحيّز في العينات 
باستخدام الأوزان الاحتمالية والتي تساوي 1/(احتمالية الاختيار)» تحليل 
بيانات الدراسات الاستقصائية باستخدام الأوزان الاحتمالية يعتبر نقطة قوة 
لبرنامج ستاتاء والتي سنيتم عرضها في الفصل A‏ 

في بعض الأمثلة» عملية الوزن تشبه إلى حد ما تجميع البيانات بطريقة 
تجعل المتغيرات تلخص إحصائيات العديد من المشاهدات الفردية» hod‏ 
بيانات الملف Nations2 dta‏ تحتوي على مؤشرات التطور البشري للآأمم 
المتحدة» والتي توضح ظروف المعيشة في 194 دولة. 


-use C:\data\nations2.dta, clear 
-describe 
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Contains data from c:\data\nations2.dta 


obs: 194 UN Human Development Indicators 
vars: 13 2 Jul 2012 06:11 
size: 12,804 
storage display value 

variable name type format label variable label 

country str21 5 Country 

region byte $8.0g region Region 

gdp float %9.0g Gross domestic product per cap 
2005$, 2006/2009 

school float %9.0g Mean years schooling ‘adults) 
2005/2010 

adfert float %8.0g Adolescent fertility: births/1000 
fem 15-19, 2010 

chidmort float %9.0g Prob dying before age 5/1000 live 
births 2005/2009 

life float %9.0g Life expectancy at birth 2005/2010 

pop float $9.0g Population 2005/2010 

urban float %9.0g Percent population urban 2005/2010 

femlab float %9.0g Female/male ratio in labor force 
2005/2009 

literacy float %9.0g Adult literacy rate 2005/2009 

co2 float %9.0g Tons of CO2 emitted per cap 
2005/2006 

gini float %9.0g Gini coef income inequality 
2005/2009 





Sorted by: region country 


"متو “Mean” "dau‏ العمر المتوقع هو 7 سنة: 
-Summarize life‏ 


Variable Obs Mean Std. Dev. Min Max 





life 194 68.7293 10.0554 45.85 82.76666 


المتوسط أعلاه يمثل متوسط العمر المتوقع للسكان في 194 دولة بالعينة 
وليس لكل السكان 7 مليارات القاطنين في هذه egal‏ حيث إن وزن متوسط 
العمر لأصغر دولة (توفانلو هي جزيرة صغيرة في المحيط الهادئ بعدد 
اسكان يبلغ حوالي 0 نسمة) هو نفسه متوسط العمر المتوقع لأكبر دولة 
(الصين وعدد سكانها حوالي 1.3 مليار نسمة) ولكن 'باستخدام عدد السكان 
كوزن تكراري يمكننا الحصول على توقعات أكثر دقة عن متوسط العمر 
المتوقع لعدد السكان 7 مليارات ككل. 
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.Summarize life [fweight=pop] 


Variable Obs Mean Std. Dev. Min Max 
life | 6.669e«09 68.93644 8.095538 45.85 82.76666 
سوف تتم مناقشتها بتقصيل أكثر في‎ (pweight) الأوزان الاحتمالية‎ 
مفيدة مع إنشاء الرسومات البيانية.‎ (aweight) الفصل 4 والأوزان التحليلية‎ 
وسيتم شرحها في الفصل .3( أما المربعات الصغرى الموزونة فسوف يتم‎ 
شرحها في الفصلين 7 و8 مع بعض المواضيع الأخرى؛ أهمية الأوزان ليس‎ 
لأغراض‎ Lapai لها تعريف محددء ولكن يمكن تطبيقها في برامج مكتؤبة‎ 
محددة.‎ 
: إنشا؟ بيانات عشوائية وعينات عشوائية‎ 
Creating Random Data and Random Samples 


دالة الأرقام شبه العشوائية runiform()‏ تأتي في مقدمة الدوال التي 
تعطي لبرنامج ستاتا .القدرة على إنشاء بيانات عشوائية أو عينات عشوائية 
دليل المستخدم Base Reference Manual‏ يعرض شر IK la‏ لكيفية عمل 
دالة الأرقام شبه العشوائيةء إذا كانت هناك بيانات في الذاكرة الحالية لبرنامج 
ستاتاء فإن V ul‏ مثل الأمر أدناه يقوم بإنشاء متغير جديد باسم random‏ 
بطريقة عشوائية بقيمة 16 رقم يفصل بينها (0,1]. 
-generate randnum-runiform()‏ 
كما يمكننا إنشاء بيانات عشوائية من العدم» وللقيام بذلك سوف نقوم أولا 
بمسح البيانات الموجو دة بالذاكرة الحالية لبرنامج ستاتا (إذا كانت هذه البيانات 
مهمة فيجب حفظها (YÍ‏ ثم نقوم بتحديد عدد المشاهدات المرغوب بها في 
البيانات الجديدة» ثم تحديد تكرار الأرقام العشوائية مما يجعل عملية إنتاج 
نفس البيانات Gay‏ عماية Algu‏ وأخيرا نقوم بإنشاء المتغير العشوائي؛ الأمر 
أدناه يقوم بإنشاء بيانات تحد تحتو ي غل 0 مشاهدات ومتغير واحد يسمى 
randy ım‏ 
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-clear 


-set obs 10 

.Set seed 12345 

generate randum = runiform() 
list 


.309106 
.6852276 
412377815 
.5617244 
.3134516 


. 5047374 
.7232868 
.4176817 

. .6768828 
10. .3657581 





بالجمع بين دوال الجبر والإحصاء الخاصة ببرنامج ستاتا runiform()‏ 
يمكن إجراء قيم لعينة تم جمعها من توزيعات نظرية (Ae ga‏ فإذا كنا نريد 
متغيرًا yaa‏ لنفرض أن اسمه newvar‏ لعينة تم جمعها من توزيع منتظم 
حتى (0,428] Ya‏ من المعتاد وهو (0,1] فإننا نقوم بطباعة الأمر. 
generate newvar = 428 * runiform()‏ 
الأمر سوف يظل ينتج Lad‏ حتى 16 رقماء ولكن قد نريد aef‏ 
صحيحة فقط من 1 إلى 428( الدالة ceil‏ توفر طريقة سهلة للقيام بذلك: 


‘generate newvar-ceil(428*runiform()) 


ولإنشاء Aue‏ عشوائية من 1000 مشاهدة وجدولها التكراري يتكون من. 
6 خانات نقوم بطباعة الأوامر التالية: 
Clear‏ 
-set obs 1000‏ 


‘generate roll = ceil(6*runiform()) 
:tabulate roll 
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نظريا نحن نتوقع أن نجد أن رقم 1 تكرر بنسبة %16.67 وأن رقم 2 
بنسبة %16.67 وهكذاء ولكن في أي عينة مثل تلك التي لدينا GY!‏ والتي بها 
0 مشاهدة» فإن نسبة كل مشاهدة سوف تتباين بشكل عشوائي حول القيم 
المتوقعة. 

ولإنشاء عينة مجموعة تتكون من 1000 مشاهدة وجدول تكراري 
يتكون من زوجين من رقم 6 يكون الأمر. 

‘generate dice = ceil(6*runiform()) + 


ceil(6*runiforn(() 
-tabulate dice 


dice Freq. Percent Cum. 





يمكننا Laf‏ استخدام n‏ لتكوين Aue‏ صناعيةء الأوامر التالية تقوم 
بإنشاء بيانات تتضمن 0 مشاهدة ومتغير واحد باسم index‏ يحتوي على 
قيم من 1 إلى 5000. 
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-set obs 5000 
-generate index = n 





-summarize 
Variable Obs Mean Std. Dev. Min Max 
roll 1000 3.521 1.73279 1 6 
dice 1000 6.953 2.429546 2 12 
index 5000 2500.5 1443.52 1 50 


لإنشاء متغيرات عشوائية من توزيع طبيعي (توزيع جاوس) نستخدم دالة 
«rnormal()‏ الأمر التالي يقوم بإنشاء بيانات تتضمن 2000 مشاهدة 
ومتغيرين اثنين هما: المتغير z‏ من المجتمع N(0,1)‏ والمتغير u‏ من 
N(500,75)‏ 


-clear 

-set obs 2000 

-generate z=rnormal () 
-generate u=rnormal (500,75) 


المتوسط الفعلي للعينة والانحراف المعياري يختلف قليلاً عن القيم 


-summarize 


Variable Obs Mean Std. Dev. Min Max 





z 2000 -.0016761 1.013879 -3.645242 3.620961 
u 2000 498.4816 73.5583 248.0803 739.0969 


e 5l تتبع‎ v=e كان المتغير 2 يتبع التوزيع الطبيعي» فإن‎ I3 
بناء على توزيع‎ v اللوغاريتمي الطبيعيء ولإنشاء متغير لوغاريتمي طبيعي‎ 
طبيعي معياري نقوم بالتالي:‎ 

-generate v=exp(rnormal () )‏ 
استخدام اللوغاريتمات يجعل قيم المتغير أكثر تناسقا. 


لإنشاء قيم للمتغير 7 والتي تم الحصول عليها عشوائيا من توزيع qe‏ 
بمتوسط وانحراف معياري يساوي =p‏ 739 
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generate w=-3 * lIn(runiform()) 
بالنسبة للمتوسطات والانحرافات المعيارية الأخرى» سوف يتم‎ 
الاستعاضة عنها بثلاثة متغيرات أخرى.‎ 
5 يتبع توزيع كاي تربيع مع درجة حرية تساوي‎ x5 
-generate x5 = rchi2(5) 
يتبع توزيع ذا الحدين وتم إعطاؤه 0 محاولات مع نسبة احتمال‎ y 
0.2 نجاح‎ 
generate y = rbinomial(10,.2) 
45 يتبع توزيع ۲ مع درجة حرية تساوي‎ 45 
-generate t45 - rt(45) 
للحصول على قائمة كاملة بالدوال‎ help random قم بطباعة الأمر‎ 
الأخرى المتوافرة لإنشاء متغيرات عشوائية من توزيع بيتاء وتوزيع جاماء‎ 
والتوزيع فوق الهندسيء والتوزيع ذي الحدين؛ وتوزيع بواسون.‎ 
يوفر طريقة أخرى لإنشاء متغيرات طبيعية متعددة‎ :drawnorm الأمر‎ 
وبه خيار ات لتحديد الارتباط بين تلك المتغيرات» باستخدام الأمر‎ 
سوف يتم إنشاء بيانات تجتوي على 5000 مشاهدة لمتغير واحد‎ 01 
كما يلي:‎ N(0,1) من‎ 


-Clear 
-drawnorm z, n(5000) 
-Summarize 
Variable Obs Mean Std. Dev. Min Max 
z 5000 .0175441 .9919173 -4.112056 3.37486 


الآن سوف نقوم بإنشاء ثلاثة متغيرات أخرى: المتغير 1× من المجتمع 
«N(0,1)‏ المتغير x2‏ من (N(100,15)‏ المتغير x3‏ من «N(500,75)‏ بالإضافة 
إلى ذلك سوف نعطي لهذه المتغيرات ارتباطات المجتمع التالية: 
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x2 | 0.4 1 0 


x3 | -08 0 1 
CMS) Aba. Qs Y culis GL هذه‎ ca إنشاء‎ Gee 
` .drawnorm jay! مع‎ C واستخدام‎ 


mat C= (1, .4, -.8 ١ .4, 1, O ١ -.8, 0, 1) 
.drawnorm x1 x2 x3, means (0,100,500) 
sds(1,15,75) corr(C) 

.Summarize x1-x3 





Variable Obs Mean Std. Dev. Min Max 
x1 5000 -.0268606 .9969571 -3.635491 3.657701 
x2 5000 99.77643 14.90536 42.78308 157.9469 
x3 5000 500.2264 76.41673 227.5245 731.9073 


-correlate x1-x3 
(obs=5000) 





x2 0.3787 1.0000 
x3 -0.8024 0.0181 1.0000 


قارن بين ارتباط المتغيرات ومتوسطاتها بالعينة مع القيم النظرية 
المعطاة سابقاً. البيانات العشوائية التي تم إنشاؤها بهذا النمط يمكن اعتبارها 
كعينة تم سحبها من مجتمعات نظرية ولا يجب أن نتوقع أن هذه العينات للها 
نفس سمات المجتمعات بالضبط (في هذا المثال سمات العينة كانت: متوسط 
المتغير 3× يساوي 500 وارتباط المتغيرين x-x2‏ يساوي 0.4« وارتباط 
المتغيرين x1-x3‏ يساوي 0- وهكذا)؛ العينات الصناعية المترابطة أو 
غير المترابطة يمكن إنشاؤها باستخدام قوائم ستاتاء ونوافذ الحوار التي يمكن 
الحصول عليها كما يلي:. 
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Statistics < Other » Draw a sample from a normal distribution 
أو من خلال:‎ 
Statistics < Other » Create a dataset with specified correlation 
structure 
لإنشاء عينات‎ runiform باستخدام بسيط لدالة‎ agu :sample الأمر‎ 
Aux] عشوائية لبيانات من ذاكرة ستاتا. فعلى سبيل المثالء لإلغاء كل بيانات‎ 
مع الإبقاء على نسبة 9610 فقط من البيانات الأصلية قم بطباعة الأمر:‎ 
-sample 10 
يقوم بالإبقاء‎ sample فإن الأمر‎ df أو المحدد‎ in وعند إضافة المحدد‎ 
فقط على المشاهدات التي تنطبق عليها المعايير المطلوبة:‎ 
-Sample 10 if age« 26 
Nor الأمر أعلاه سوف يُبقي على نسبة %10 من المشاهدات كحد‎ 
أكبر من أو يساوي 26( 13 كانت المشاهدات التي‎ age والتي فيها متغير‎ 
جاوزت‎ ds قيمتها أكبر من أو تساوي 6 فسوف يتم الإبقاء عليها حتى‎ 
.9610 
يمكننا اختيار عينات عشوائية من حجم معين»لإلغاء كل المشاهدات التي‎ 
تم اختيارها عشوائياً من بيانات في ذاكرة ستاتا نقوم بطباعة الأمر.‎ 


-sample 90, count 


الجزء الخاص بمحاكاة مونت كارلو في الفصل )14( يشرح بشكل 
تفصيلى أكثر عملية إنشاء متغيرات عشوائية. 


: برام لإداره البيانات‎ als 
Writing Programs for Data Management 
إدارة البيانات في المشروعات الكبيرة تتضمن في العادة مهمات تكرارية‎ 
أو قابلة لحدوث الأخطاء فيهاء ويمكن لبرنامج ستاتا التعامل معها من خلال‎ 
ولكننا‎ eee البرمجة المتقدمة يمكن أن تكون أكثر‎ PST كتابة برامج‎ 
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يمكن أن نبدأ بكتابة برامج بسيطة تحتوي فقط على تسلسل لأوامر ستاتا يتم 
كتابتها وحفظها في ملف نصي» والملفات النصية يمكن إنشاؤها باستخدام أي 
برنامج محرر نصي يُفضله المستخدم أو برنامج المفكرة والذي يوفر عدة 
أنواع من الملفات النصية التي تحتوي على خيارات مختلفة عند الحفظ File‏ 
Save As‏ >« إحدى الطرق السهلة لإنشاء ملفات نصية يتم باستخدام نافذة 
Do-file Editor‏ ببرنامج ستاتا والتي يمكن الوصول إليها عن طريق اختيار 
Window > Do-file Editor‏ أو بالضغط على أيقونة cil‏ أو من خلال 
طباعة الأمر doedit‏ أو 00601 إذا كان هناك أي ملف filename‏ 
نصي سبق تخزينه» الأوامر في نافذة المعاينة Review Window‏ يمكن 
تحديدها وإرسالها مباشرة إلى نافذة Do-File Editor‏ (انقر زر الفارة الأيمن 
للحصول على قائمة الاختيارات)ء الأوامر يمكن نسخها ولصقها في نافذة 
Do-File Editor‏ من أي مصادر أخرى مثل ملفات التسجيل أو نافذة النتائج. 

في العديد من إجزاء هذا الفصل بدأنا ببناء بياننات درجات الحرارة 
العالمية lea‏ من درجة الحرارة ثم dale}‏ تشكيل ودمج مؤشر ENSO‏ 
وأخيرا تمثيل المؤشر ودرجات الحرارة في رسم بياني في الشكل (4.2). 
الأوامر التي قامت بتنفيذ كل هذه الخطوات يمكن تجميعها في ملف نصي 
واحد eina LS‏ شرحه الآن» يجب ملاحظة J‏ استخدام // للإشارة بأن الأمر 
graph twoway‏ يستمر SY‏ من سطر واحد. في النهاية سوف يتم حفظ 
الرسم البياني في الشكل )4.2( بالامتداد (emf)‏ 


insheet using c:\data\glbal.csv, comma clear 
label data "Grlbal climate" 

label variable year "Year' 

label variable month "Month' 

label variable temp "NCDC global temp anomaly 
vs 1901-2000, c" x 

generate edate - mdy(month, 15, year) 

label variable edate "elapsed date" 

format edate %tdmcy 

Sort year month 

order year month edate 

Save c:\dataglobal2.dta, replace 
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use c:\data\MEIO.dta, clear 
reshape long mei, i(year) j (month) 
sort year month 
label variable mei "Multivariate ENSO Index 
save c:\data\meil.dta, replace 
use c:\data\global2.dta, clear 
merge 1:1 year month using c:\data\meil.dta 
sort year month 
drop _merge 
compress 
save c:\data\global3.dta, replace 
graph twoway line temp edate/// 

|| line mei edate, yaxis (2) lpattern(dash) /// 

|| if year>1949, legend(row(2)) 
graph ‘save Graph "C:\graphs\fig02_04.gph", 
replace 
graph export "C:\graphs\fig02_04.emf", as(emf) 
replace 
هذا الملف سوف يتم إغداده بتحديد الأوامر في نافذة المعاينة ثم اضغط‎ 
ملف‎ Liss ثم قم‎ Send to 00-816 Editor على الزر الأيمن للفارة واختر‎ 

do-file‏ باسم جديد مثل cglobaldo‏ من القائمة أو ٠يكتابة‏ الأمر: 

-do global 


مثل هذا النوع من البرامج في العادة يتم حفظه بامتداد “do”‏ وهناك 
برامج أكثر دقة (يتم إعدادها بواسطة ملفات do-files‏ أو تلقائيا بواسطة 
ملفات (ado-files‏ يمكن حفظها في ذاكرة ستاتا وتشغيل هذا الملف على 
برامج أخرى وإنشاء أوامر جديدة لبرنامج ستاتا وفتح ملف وورد للأخطاء 
المحثملة. 

برنامج ستاتا يقوم بتفسير نهاية سطر الأمر كنهاية للأمر نفسهء هذا 
معقول على الشاشة عندما يكون طول الأمر على عرض الشاشة ولكن قد 
يكون الأمر طويلاً las‏ بحيث لن يعمل عند طباعته في ملف نصيء لذلك فإن 
وجود ثلاث شرطات مائلة /).في نهاية سطر الأمر يشير إلى أن الأمر 
مازال d yas‏ في السطر التالي» ولن يتم تنفيذ الأمر في حالة الوصول إلى 
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نهاية سطر الأمر مع ملاحظة أن وجود (N‏ لا يعني الوصول إلى نهاية 
الأمر. 
هناك طريقة أخرى للتعامل مع الأوامر الطويلة في ملفات 00-5165 
وذلك باستخدام الأمر Cus Hdelimit;‏ يحتوي على فاصلة منقوطة (:) في 
نهاية الأمر. في المثال أدناهء نقوم باستخدام الفاصلة المنقوطةء فبعد طباعة 
Y dash jd‏ تميق حت P sels‏ الفاصلة ass) Ae gina‏ فلك casali ass‏ 
إلى قيمتها الاعتيادية باستخدام المحدد (cr)‏ 
م #delimit‏ 
Graph twoway line temp edate‏ 
line mei edate, yaxis(2) lpattern(dash)‏ || 


|| if year>1949, legend(row(2)) ; 
#delimit cr 


في US‏ مرة يصل فيها برنامج ستاتا لنافذة النتائج يتوقف حتى نقوم 
بالضغط على مسافة في لوحة المفاتيح أو أي مفتاح آخر أو اضغط على 
أيقونة © Yas‏ من التوقف يمكن الطلب من برنامج ستاتا الاستمرار في 
العمل حتى إظهار النتائج بالكامل وذلك بطباعة الأمر التالي: 


-set more off 


هذا الأمر يعتبر مناسباً إذا كان البرنامج يعرض مخرجات بحجم JS‏ 
على الشاشة؛ ونحن لا نحتاج إلى رؤية هذه المخرجات أو نحن نقوم بكتابة 
السابق بحيث يجب علينا النقر على أي مفتاح لإظهار بقية النتائج نطبع 
الأمر. 


-set more on 


- 


cU! 
الرسومات البيانية‎ 
Graphs 





تظهر الرسومات البيانية في كل فصل بهذا الكتاب» وهذا مؤشر على 
أهميتها وتداخلها مع التحليلات الأخرى ببرنامج ستاتا. الرسومات البيانية 
التحليلية تعتبردائما إحدى نقاط القوة ببرنامج ستاتاء والسبب أن هناك العديد 
من الخيارات التي يتيحها برنامج ستاتاء ولا توجد في البرامج الإحصائية 
الأخرى. كما أن هذه الرسومات البيانية جذابة وقابلة للنشر وعملية إدراجها 
سهلة» وتتم من خلال استخدام الأوامر أو استخدام قوائم ستاتا باختيار 
685 ,6 وبالنسبة المستخدمين الذين يتصورون الحصول على رسومات 
بيانية دقيقة ورائعة سوف يجدون أن ما يتصورونه Lally‏ مع وجود العديد من 
الأدوات والخيارات المثيرة والمشروحة بتفصيل أكثر في دليل المستخدم 
Graphics Reference Manual‏ 3 هناك العديد من الأمثلة مثلة في الدليل المرئي 
للرسومات البيانية ببرنامج ستاتا للمؤلف (Mitchell 2012(4 Visual Guide to‏ 
„Stata Graphics‏ 

في هذا الفصل» سوف يتم شرح عدة gl sil‏ من الرسومات البيانية 
الرئيسة ببرنامج ستاتا وسيكون الشرح بأمظة عملية بدلا من الشرح النظري 
فقط (انظر دليل المستخدم Graphics Reference Manual‏ أو استخدم ملفات 
المساعدة help‏ للحصول على شرح نظري أكثر), بعض من أمثلة هذا 
الفصل سهلة das‏ وتستخدم خيارات ALI‏ وأحيانا لاتستخدم أي خيارات 
ولكن عادة AY‏ البسيطة يتبعها أمثلة ASÍ‏ تعقيد ladies‏ مع بعض الخيارات 
التوضيحية وشرح عن كيفية إعداد الرسومات البيانية الجاهزة للنشرء 
وبالرغم من أن هذا الفضل يمكن yy yall‏ .عليه سريعا بقراءة كل ca‏ ولكنه 
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يعتبر معرضا للصور والأفكار التي يمكن استخدامها في إعداد الرسومات 
Asl‏ 

المجموعة الكاملة للخيارات المتعلقة بالرسومات البيائية هائلة جداً ولا 
يمكن لهذا الكتاب أن يغطيها بالشرح ولكن أمثلة هذا الفصل توضح مجموعة 
ALS‏ من هذه الخيارات» وفي فصول لاحقة سوف يتم الشرح بصورة أكثر 
تفصيلاء وتوفر قائمة ستاتا Graphics‏ الخيارات التي يمكن النقر عليها 
للوصول إلى قوائم الرسومات البيانية مع نوافذ حوار توجد بكل نافذة منها 
أيقونة «Submit‏ هذه القائمة تعتبر طريقة مفيدة لتعرف ما هو متوافر من 
خيارات للتعامل مع العديد من الرسومات البيانية ذات الاتجاهين. 


Example Commands : عن الأوامر‎ alioi 


.histogram y, frequency 
موضحا التكرارات على‎ y برسم مضلع تكراري للمتغير‎ ja! يقوم هذا‎ 
المحور العمودي.‎ 
.histogram y, start(0) width(10) norm fraction 
يقوم برسم مضلع تكراري للمتغير ر بعرص 10 وحدات للمضلع‎ 
التكراري ويبدأ من نقطة 0ء وإضافة منحنى التوزيع الطبيعي بناء على‎ 
المتوسط والانحراف المعياري للعينة+ كما أن الرسم يعرض كسور البيانات‎ 
على المحور العمودي.‎ 
-histogram y, by(x, total) percent 
لكل قيمة من‎ y في شكل واحد يتم رسم عدة مضلعات تكرارية للمتغير‎ 
كما أن المضلع التكراري الأخير يعطي المجموع للعينة ككل‎ ox المتغير‎ 
ويعرض نسبا مئوية على المحور العمودي.‎ 


5 kdensity x, generate(xpoints xdensity) 
width(20) biweight 


يقوم هذا الأمر بإنشاء منحني الكثافة اللبي kernel density‏ لتوزيع المتغير 
ax‏ وإنشاء متغيرين جديدين في البيانات هما المتغير xpoints‏ ويحتوي على 
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قيم المتغير x‏ والتي تم تقدڊر کثافتهاء والمتغير xdensity‏ مع كثافة تم تقديرها 
Lal‏ الخيار width(20)‏ يحدد نصف عرض مركز الكتافة KM‏ للمتغير 
x‏ وإذا لم يتم تحديد الخيار ( width(‏ فإن الوضع الافتراضي هو اتباع صيغة 
Abus‏ للمشتوئ Lal «fue!‏ الخيار biweight‏ ففي مثالنا هذا سوف يحدد 
مركز كثافة ثنائي او يدلا من الوضع الافتراضي وهو استخدام نواة 
.Epanechnikov‏ 
.graph twoway scatter y x‏ 
يعرض رسم بياني jas DU‏ الخطي للمتغير ule y‏ المتغير ox‏ الخيار 
graph‏ هو جزء اختياري لجميع أوامر twoway‏ فمثلا يمكننا طباعة الأمر 
-twoway scatter y x‏ 
-graph twoway lfit y x || scatter y x‏ 
يقوم الأمر بإنشاء رسم بياني ثنائي لانحدار الخطي للمتغير رعلى 
المتغير ex‏ حيث يظهر في الرسم خط الانحدار (خط الانحدار أو (Ifit‏ للمتغير 
بر مقابل المتغير x‏ كما يعرض الرسم Lad‏ انتشار قيم المتغيرين × وبر والذي 
يوضح أن درجة الثقة %95 في نطاق الانحدار الخطي. 
-graph twoway scatter y x, xlabel(0(10)100)‏ 
ylabel(-3(1)6,horizontal)‏ 
يقوم بإنشاء رسم بياني نقطي لانشاء قيم المتغير y‏ مقابل المتغير x‏ مع 
إعطاء المحور الأفقي × قيم 40 10( ... 100 والمحور العمودي e$ y‏ 7 
e2-‏ ... 6» مع كتابة الأسماء في وضع أفقي بدلا من الوضع الافتراضي 
وهو الوضع العمودي. 
-graph twoway scatter y x, mlabel (country)‏ 
يقوم بإنشاء رسم بياني نقطي لإنشاء 3 قيم المتغير y‏ مقابل المتغير Cus x‏ يتم 
عرض البيانات على شكل نقاط» وكل نقطة لها اسم» وهو'قيمة المتغير -country‏ 
-graph twoway scatter y x1, by(x2)‏ 
2 الأمر بإنشاء رسم بياني موحد لشكل انتشار المتغير y‏ مقابل 1× 
ووضع مخطط منفصل لكل قيمة من قيم x2‏ 
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.graph twoway scatter y x1 [fweight = 
population], msymbol(oh) 


يقوم الأمر بإنشاء رسم بياني نقطي لانتشار قيم المتغير y‏ مقابل المتغير 
x]‏ على شكل دوائر صغيرة (Oh)‏ وتكون مواقع هذه الدوائر تميل للوزن 
التكراري للمتغير population‏ 
.graph twoway connect y time‏ 
يقوم هذا الأمر بإنشاء رسم lanua ily‏ للمتغير ر مقابل المتغير time‏ 
حيث يتم تمثيل البيانات بنقاط يصل بين كل نقطة وأخرى bs‏ ولعرض 
الخط الواصل بين هذه النقاط بدون إظهار النقاط قمنا باستخدام الخيار line‏ 
بدلا من الخيار connect.‏ كما يلي: 
-graph twoway line y time‏ 
الطريقة الأخرى لإنشاء رسم بياني مبسط للفترة الزمنيةء تتم باس تخدام 
الأمر tsline‏ والذي يعمل مع الأمر tsset‏ وهذا الأخير يُستخدم لتحديد المتغير 
الذي يمثل الزمن (انظر الفصل 12( — " 
.tsline y‏ 
-graph twoway line yl y2 time‏ 
يقوم الأمر برسم بياني للفترة الزمنية (في هذا المثال الرسم البياني 
سوف يكون من النوع الخطي) مع متغيرين هما y]‏ و2برولهما نفس 
المقياس» وسوف يتم تمثيلهما برسم بياني مع المتغير time‏ 


-graph twoway line y1 time, yaxis(1) || line y2 
time, yaxis(2) 


> 


يقوم الأمر برسم بيانات المتغيرين ١ر y2‏ ولهما قياسات مختلفة» حيث 

يتم وضع المنحنيين على نفس الرسم البياني» ويكون المحور العمودي في 

جهة اليسار yaxis(1)‏ يمثل قياس المتغير y]‏ بينما المحور العمودي في جهة 
اليمين yaxis(2)‏ يمثل قياس المتغير y2‏ 

-graph twoway contour temperature yx 

هذا الأمر يقوم بإنشاء زسم بياني ملون يعرضص متغير temperature‏ على 

شكل شرائح مع المتغيزين Cus y 5 x‏ إن Gude‏ المتغيرين يشبهان إحداثيات 
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مثل عدد الألوان وطرق إضافة ألوان أخرى. 
.graph matrix x1 x2 x3 x4 y‏ 
يقوم هذا الأمر بإنشاء مصفوفة من الرسومات البيانية في شكل واحد 
يعرض كل أشكال الانتشار المحتملة الممكنة لكل المتغيرات الموجودة. 
graph box y1 y2 y3‏ 
gh‏ هذا الأمر بإنشاء رسم بياني على شكل صندوق لكل متغير من 
المتغيرات y2, y3‏ ,1 
.graph box y, over(x) yline(23)‏ 
يقوم هذا الأمر بإنشاء رسم بياني على USA‏ صندوق للمتغير .رمع كل 
قيمة من ad‏ المتغير × ورسم خط أفقي عندما تكون قيمة 23 = ر 
.graph pie abc‏ 
يقوم بإنشاء رسم بياني دائري مقسم إلى celal‏ يشير كل جزء إلى 
القيمة المتعلقة بكل متغير من المتغيرات a, b, e‏ ويجب أن تقاس هذه 
المتغيرات بنفس وحدة القياس. 
-graph bar (sum) a b c‏ 
يعرض هذا الأمر مجموع المتغيرات » a, b,‏ بأعمدة متراصة جنبا إلى 
جنب» وللحصول على المتوسط بدلا من المجموع نقوم بطباعة الأمر 
graph bar (mean) a b c‏ وهناك خيارات أكثر تتضمن الحصول على الوسيط 
ونسب مئوية وأعداد وإحصاءات أخرى لكل متغير (هذه الخيارات مثل 
(collapse‏ 
graph bar (mean) a, over(x)‏ 
يقوم هذا الأمر بإنشاء رسم بياني يعرض متوسط المتغير + مع كل قيمة 
من e‏ المتغير ×. 7 
.graph bar (asis) a b c, over(x) stack‏ 
يقوم هذا الأمر برسم أعمدة لكل قيم المتغيرات a, 8, c‏ حيث يتم وضع 
قيمة كل متغير فوق الأخرى في عمود واحد لكل قيمة من قيم المتغير ×. 
-graph dot (median) y, over(x)‏ 
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يقوم هذا الأمر برسم شكل نقطي حيث إن كل نقطة تمثل علامة مقياس أفقي 
لقيمة الوسيط للمتغير y‏ عند كل قيمة من قيم المتغير ox‏ الأمر graph dot‏ يدعم 
نفس الخيارات الإحصائية التي يدعمها الأمر graph bar‏ والأمر collapse‏ 
.qnorm y‏ 
يقوم هذا الأمر بإنشاء رسم بياني يوضح التوزيع الطبيعي لقيم المتغير بر 
المتعلقة مع فئات التوزيع الطبيعي. 
.rchart x1 x2 x3 x4 x5, connect(1)‏ 
يقوم هذا الأمر بإنشاء رسم مراقبة الجودة R‏ موضحاً مدى القيم الممثلة 
بالمتغيرات من المتغير ×١‏ إلى المتغير 5د وللحصول على قائمة كاملة 
بالخيارات التي يوفرها برنامج ستاتا عن هذا الأمرء قم بطباعة «help qc‏ 
والأمر أعلاه يمكن تطبيقه من خلال استخدام قوائم ستاتاء وذلك باختيار 
Graphics > Quality control‏ 


خيارات الرسم البياني مثل التحكم في العناوين والتوصيفات وعلامات 
الاختيار على المحاور في الرسم من الخيارات الأكثر شيوعا في جميع أنواع 
الرسومات البيانية ببرنامج ستاتاء كما أن . التركيب المنطقي لأوامر ستاتا 
الخاصة بالرسوم البيانية ثابت من نوع «SY‏ وهذه العناصر المشتركة تعتبر 
ميزة رئيسة تسهل عملية إنشاء أي رسم بياني. 


‘Histograms : GAKI &ybl 


يعرض المدرج التكراري توزيع مقاييس المتغيرات» ويتم إنشاء هذا 

المخطط بالأمر Stud chistogram‏ بالرجوع إلى بيانات مثالنا السابق عن 

4 دولة في الفصل (2) والذي يحتوي على بيانات مؤشرات التطور 
البشري والتي تم جمعها بواسطة الأمم المتحدة. 

euse C:\data\Nations2.dta, clear 

.describe 
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Contains data from c:\data\Nations2.dta 








obs: 194 UN Human Development Indicators 
vars: 13 2 Jul 2012 06:11 
size: 12,804 
storage display value 
variable name type format label variable label 
country str21 5 Country 
region byte $8.0g region Region 
gdp float %9.0g Gross domestic product per cap 
20055, 2006/2009 
school float 59.09 Mean years schooling (adults) 
2005/2010 
adfert float 58.09 Adolescent fertility: births/1000 
fem 15-19, 2010 
chldmort float %9.0g Prob dying before age 5/1000 live 
: births 2005/2009 
. life float %9.0g Life expectancy at birth 2005/2010 
` pop float %9.0g Population 2005/2010 
urban float 59.09 Percent population urban 2005/2010 
femlab float 59.09 Female/male ratio in labor force 
3 1 2005/2009 ١ 
literacy. float %9.0g Adult literacy rate 2005/2009 
'co2 ` float $5$9.0g Tons of CO2 emitted per cap 
2005/2006 
-gini float %9.0g Gini coef income inequality 
2005/2009 





Sorted by: region country 
وهو يمثل‎ «adfert الشكل )1.3( يحرض رسما لمدرج تكراري بسيط للمتغير‎ 


معدل خصوبة المراهقين. وهذا الرسم البياني تم إنشاؤه بواسطة الأمر التالي: 
.histogram adfert, percent‏ 
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Adolescent fertility: births/1000 fem 15-19, 2010 


الشكل )1.3( 
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في قائمة ستاتا Edit > Preferences > Graph Preferences‏ لدينا 
yis‏ عة ن e uaa sacan cas] cd AW‏ ن ST‏ اة و اف 
والرسومات البيانيةء كما يمكن تحديد رسومات بيانية مخصصة لأغراض 
معينةء أغلب الأمثلة في هذا الكتاب سوف تستخدم لونين Li‏ مع هامش 
مظلل حول الرسم البياني. إن عملية اختيار اللونين الأبيض والأسود وألوان 
أخرى للرسومات البيانية يساعدنا في تحديد أفضل الأشكال لكل غرض من 
الأغراض المطلوبةء والرسم البياني يتم إنشاؤه وحفظه تحت تصنيفات معينة 
بحيث يمكن استعادته وإعادة فظه تحت تصنيف آخرء كما سوف يتم الشرح 
لاحقا. 

خيارات الرسم يمكن استخدامها بعد إضافة فاصلة إلى أمر إنشاء الرسم 
البياني» فالرسم البداني بالشكل (1.3) يوضح خيارا واحذا وهو النسبة المئوية 
Ya) percent‏ من density‏ وهو الخيار الافتراضي) حيث يتم عرض النسبة 
المئوية على المحور العمودي» وعند ظهور الرسم البياني على الشاشة توجد 
في نافذة الرسم مجموعة من قوائم الخيارات التي تتيح طباعة الرسم وحفظه 
ونسخه ولصقه في برامج أخرى مثل مايكروسوفت وورد. 

الشكل (1.3) يشير إلى التواء موجب للتوزيع مع منوال قريب من 
الصفرء وحد أعلى حوالي 200( من الصعب إعطاء شرح jS‏ دقة لهذا 
الرسم» لأن الأعمدة لم يتم رسمها لتعبر عن قيم المحور JE a ai‏ 
(2.3) يعرض نفس الرسم البياني السابق بطريقة أخرى مع خيارات أخرى 
يمكن أن تجعل الرسم البياني أكثر وضوحاً: 

frequency‏ التكرارات سوف تعرض على المحور العمودي بر 

start(0)‏ العمود الأول في المدرج التكراري سوف يبدأ من الصفر. 

width(10)‏ عرض كل عمود في الرسم البياني سوف يكون 10 وحدات. 

xlabel(0(20)200)‏ المحور الأفقي x‏ سوف يبدأ من الصفر وحتى 200 بزيادة قدرها 
0 بين كل قيمة واخرى. 
xtick(10020210)‏ سو. » تكون هناك نقاط في المحور الأفقي + من 10 إلى 210 
بزيادة قدرها 20. 
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ylable(0(2)12,grid gmax)‏ المحور العمودي بر سوف يبدأ من 0 إلى 35 بزيادة قدرها 
أعلى قيمة. 
 title("Adolescent fertility rate in 194 nations")‏ وضع عنوان للرسم البياني في أعلى 
"T‏ 
الأمر أدناه والذي كتب في أربعة أسطر لتسهيل عملية قراءته» ولجعل 
هذه الأسطر تعمل في ملف تنفيذي do-file‏ يمكننا إضافة ثلاث شرطات خلفية 
// في نهاية كل سطر من الثلاثة أسطر الأولى؛ والتي تشير إلى أن الأمر 
مازال مستمرا في السطر التالي: 
.histogram adfert, frequency start(0) width(10)‏ 
xlabel(0(20)200) xtick(10(20)210)‏ 
ylabel(0(5)35, grid gmax)‏ 


title ("adolescent fertility rate in 194 
nations") 


adolescertt fertility rate in 194 nations 


Frequency 
15 20 25 30 35 
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الشكل )2.3( يساعدنا في شرح التوزيع بشكل أكثر دقةء فمثلاً الآن 
يمكن أن نرى أن معدل خصوبة المراهقين في 34 دولة يتراوح بين 10 
,20« وللحصول على قائمة كاملة بخيارات وتركيبة الأمر histogram‏ قم 
بطباعة الأمر chelp histogram‏ وهناك أيضًا أمر gui esi‏ المدرج 
التكراري وهو الأمر Cus twoway histogram‏ يسمح لنا باستخدام خيارت 
أكثر le ut‏ مع الأمر twoway‏ سوف نناقشها lis‏ ويمكن أن تتعلم أكثر 
حول هذه الخيار ات بطباعة الأمر -help twoway histogram‏ 

asd‏ خيارات histogram Y!‏ والتي يستخدمها مع أنواع أخرى من 
أوامرالرسم بياني هي قدرته على إنشاء عدة رسوم بيانية لكل قيمة لمتغير 
معين باستخدام cby(varname) Jui‏ الشكل )3.3( يعرض losa‏ تكراريا 
للمتغير adfert‏ لكل إقليم من الأقاليم الخمسة التي تم دراستها مع رسم بياني 
سادس للمجموع (total)‏ يعرض التوزيع لكل الأقاليم. 


-histogram adfert, percent start(0) width(10) 
by(region, total) 
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زسم الصناوق : Box Plots‏ 

رسم الصندوق يعطي نظرة سريعة عن مدى تركز البياننات حول 
المركز وتشتتها وتناسقها وقيمها المتطرفةء فمثلا الشكل )4.3( يعرض رسم 
صندوق مبسط للمتغير adfert‏ (معدل خصوبة المراهقين)» حيث يمكن 
الحصول على هذا الرسم بطباعة الأمر التالي: 


.graph box adfer 
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الشكل )4.3( يؤكد الالتواء الإيجابي لهذا «qe 5 sill‏ كما يعرض ol‏ 
خمس قيم متطرفةء والصندوق في الرسم يمتد من حوالي الربع الأول إلى 
الر بع الثالث» وهذه المسافة تسمى المدى الزبيعي interquartile range (IQR)‏ 
ويتضمن المدى 7650 E‏ من البيانات» en)‏ الصندوق في برنامج ستاتا 
يحدد الربيعات بنفس الطريقة في الأمر summarize‏ والأمر (detail.‏ القيم 
المتطرفة تُعرف بأنها قيم المشاهدات الأكبر من المدى الربيعي (5.1) ؤهي 
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تقع في النطاق الخارج عن المنطقة ما بين الربع الأول والربع الثالثء وقد تم 
توضيح القيم المتطرفة في الرسم باستخدام نقاط في أعلى الشكل البياني. 
الشكل (5.3) يحدد القيم المتطرفة بالمتغير adfert‏ ويصف نقاطها في 
الرسم مع ad‏ المتغير country‏ (أسماء الدول)» كما يحدد Lil gic‏ للمحور 
العمودي Ul cy‏ الخيار marker‏ يمكنه أن يتحكم في الرموز والخصائص 
الأخرى التي تشير إلى القيم المتطرفة» فالخيار marker(1)‏ في هذا المثال 
يشير إلى أول اسم في المتغير cy‏ وهناك متغير واحد فقط باسم برولكن في 
بعض الحالات يمكننا أن نجد اثنين أو أكثرء ونحتاج إلى وضع علامات 
لقيمها المتطرفة بشكل يوضح كل متغير على Pam‏ 
.graph box adfert, marker(1, mlabel(country))‏ 
ytitle("Births per 1,000 females 15-19")‏ 
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الشكل )5.3( 
ما مع فئات متغير_ثان؛ الشكل )6.3( يقارن بين توزيع المتغير adfert‏ 
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لمجموعة من الأقاليم region‏ وبصفة عامةء فإن الوسيط تمت الإشارة إليه 
بخط أفقي بواسطة الخيار yline(39.3)‏ 


graph box adfert, marker(1, mlabel(country)) 
yline(39.3) over(region) 
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رسوم الصندوق يمكن أن يكون اتجاهها أفقيا بدلا من الاتجاه gagali‏ 
وذلك باستخدام الأمر .graph hbox‏ الشكل )7.3( يستخدم معدل انبعاث ثاني 
أكسيد الكربون لكل فرد (c02)‏ وهو متغير آخر موجود في ملف البيانات 
26 هذا المثال يعرض مجموعة من خيارات العناوين 
والتوصيفات التي يمكن تطبيقها على أي نوع من الرسومات البيانييةء 
فالخيار ( note(‏ والخيار ( caption(‏ تضع النص تحت الرسم البياني» في 
الشكل أدناه هناك عبار 3 “Statistics with Stata”‏ تظهر بخط eal‏ د عريض 
وعبارة *Example of horizontal box plots”‏ بخط مائل» وعنوان المحور 
العمودي» في الخيار ytitle‏ (عنوان المحور العمودي ريظهر فيه كل رسم 
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صندوق أفقي يشير إلى محور (ii‏ أما نسبة CO;‏ فسوف يُشار إليها 
noeud uic Ae Ses ii diode‏ 
داخل الرسم نفسه باستخدام خاصية علامات ستاتا ولغة التحكم Stata markup‏ 
cand control language (SMCL)‏ لمزيد من الأمثلة عن ذلك قم بطباعة الأمر 
help graph text‏ 


.graph hbox co2, over(region) 

note("note: (bf:Statistics with Stata), 
version 12") 

caption("c aption: United Nations Human 
Development Report 

2011") 

title("title: (it:Example of horizont al box 
plots)"). 

ytitle("ytitle: Tons of CO(subscript:2) 
emitted per capita’) 


title: Example of horizontal box plots 
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0 450 — 200 
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(73) dan” 
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القيم المتطرفة الفردية لم يتم توصيفها في الشكل (7.3) لأنه من الصعب 
قراءة الوصف في التنسيق الأفقي. أما القيم المتطرفة الثلاث في أمريكا 
25 هي GLY sll‏ المتحدة وكندا وجزيرة الترينيداد وتوباجو (وهي 
جزيرة صغيرة في شمال أمريكا الشمالية تشتهربصناعة النفط والغار في 
الكاريبي)» ونرى أن أعلى معدل لإنبعاث ثاني أكسيد الكربون للفرد بدول 
القارة الأسترالية في il‏ اليا «Oceania.‏ وهناك أربع دول مصدرة للنفط فيها 
أعلى قيم متطرفة في tAsia Gal‏ وبإلقاء نظرة أكثر تفحصا للقيم Aa Lisl)‏ 
فإن رسم الصناديق يوضح أننا أحيانا نجد أن هناك بعض المش هدات المثيرة 
في البيانات نفسها وليس فقط في الحسابات الإحصائية. 

هناك عدد كبير من خيارات التحكم في المظهر والظلال وتفاصيل 
الصناديق في الرسم البياني» وللحصول e‏ قائمة بهذه الخيارات قم بطباعة 
الأمر chelp graph box‏ وصف المحاور والنقاط والعناوين يمكن تعديلها 
بخيارات by(varname)‏ أو by(varname, total)‏ و هذه الخيار ات تعمل ب نفس 





الطريقة مع أوامر رسم بياني أخرى ببرنامج ستاتاء by(region) Sd‏ سوق 
يقوم بإنشاء رسم صندوق في خمس نوافذ صغيرة بدلاً من خمسة صناديق 
في رسم over(region) (os‏ واحد كما تم القيام به في الشكل (6.3) 
والشكل )7.3( 


Scatterplots and Overlays : الانتشار وتركيباته‎ diio 


شكل الانتشار هو جزء من عدد كبير من الرسومات البيانية إلتي تسمى 
«twoway‏ والأمر الأساسي لإنشاء شل الانتشار هو: 
-graph twoway scatter y x‏ 
tilly gga geal) joa lig y ail c] iun‏ + يل gyal‏ 
الأفقي (الجزء الرئيس للأمر graph twoway‏ اختياري ولكن تم كتابته هنا 
للتأكيد على أهميته التي سوف تتضح (lis‏ فمثلا باستخدام بيانات الملف 
6 يمكننا إنشاء رسم بياني للمتغير 6// (متوسط العمر المتوقع) مع 
المتغير schoo!‏ (متوسط سنوات الدراسة) وصورة هذا الرسم البياني تم 
عرضها في الشكل (8.3) حيث إن كل نقطة في الشكل تمثل دولة واحدة. 
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ل et RR‏ اا bos‏ 


.graph twoway scatter life school 
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كما رأينا سابقاً في المضلع التكراريء فإنه يمكننا استخدام العديد من 
الخيارات xlabel, xtitle, ylabel is‏ للتحكم في توصيف المحور الأفقفي 
والمحور العمودي والعناوين.. الخ» وكما رأينا في رسم الصندوقء فإن شكل 
الانتشار يسمح لنا بالتحكم في شكل الرسم ولونه وحجمه وتوصيفه وسمات 
abla‏ الشكل )8.3( يستخدم النقاط الافتراضية في الرسم وهي عبارة عن 
دوائر غامقة» وهناك بعض التأثيرات التي يمكننا تضمينها في الرسم 
باستخدام الخيار US «msymboi(0).‏ يمكننا استخدام خيارات TN‏ مثل 
GBs) msymbol(Th)‏ مجوفة msymbol(d) (ô S‏ (علامات ماسية 
صغيرة)» msymbol(+)‏ (علامات 5 msymbol(i) qi‏ (رموز مخفية» وهي 
طريقة عملية لبعض الأغراض الخاصة)» وللحصول على قائمة كاملة 
To‏ دلامات والخيارات قم بطباعة الأمر -help scatter‏ 
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الخيار meolor‏ يتحكم في لون النقاط في الرسم البياني» Wisi‏ الأمر: 
-graph twoway scatter waste metro, msymbol(S)‏ 
mcolor (purple)‏ 
سوف يقوم بإنشاء شكل الانتشارء بحيث إن كل نقطة بالرسم عبارة عن 
مربع أرجواني كبيرء وللحصول على قائمة كاملة بالألوان المتوافرة قم 
بطباعة الأمر help colorstyle‏ وهذه الألوان قابلة للتطبيق على الأعمدة 
والخطوط والنصوص والعناصر الأخرى في أي رسم بياني ببرنامج ستاتا. 
أحد الخيارات المثيرة التي يمكن القيام بها مع شكل الانتشار هو جعل 
حجم الرمز متناسبا مع متغير ثالث» حيث يتم إعطاء نقاط البيانات شكلا 
مختلفا. فعلى سبيل المثالء قد نقوم بإنشاء شكل أنتشار للمتغير life‏ والمتغير 
7 ولكن حجم النقاط بالرسم البياني سوف يعكس sac‏ السكان في كل 
دولة (pop)‏ وهذا ما تم عمله في الشكل )9.3( باستخدام الخيار 
[fweight=varname]‏ او باستخدام خاصية الوزن التكراريء كما V‏ خيار 

aS laa SS uxo msymbol(Oh) 44 gal. jl gall 


.graph twoway scatter life school 
[fweight=pop], msymbol(Oh) 


70 80 90 


Life expectancy at birth 2005/2010 
60 
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الأوزان التكرارية مفيدة مع بعض أنواع الرسم البياني الأخرى. وزن 
بعض العناصر يمكن أن يكون موضوعا غامضا ومعقذاء GY‏ الأوزان يمكن 
تمثيلها بأتواع مختلفةء ولها معاني مختلفة حسب السياق» وللحصول على 
معلومات عامة عن الأوزان يمكنك طباعة الأمر help weight‏ 
الخاصية الرئيسة لمجموعة graph twoway yal j‏ هي قدرتها على وضع 
شكلين أو أكثر معا لإنشاء أشكال أكثر تعقيداء فمثلا لإنشاء شكل انتشار 
للمتغير life‏ مع المتغير school‏ باستخدام دوائر مجوفة كعلامات بالرسمء 
يمكن ذلك بطباعة الأمر 
-graph twoway scatter life school, msymbol (Oh)‏ 
خطوط الانحدار البسيطة (fit)‏ هي نوع مختلف من رسومات «twoway‏ 
ولمشاهدة خط انحدار المتغير life‏ على المتغير school‏ مع تنسيق خط 
الانحدار ليكون الخط عريضا بدرجة متوسطة نقوم بطباعة الأمر. 
.-lfit life school, lwidth(medthick)‏ 
ولكن عادة نريد أن نرى شكل الانتشار» وخط الانحدار معأء يمكن القيام 
بذلك عن طريق وضع الرسم البياني fit‏ الخاص بخط الانحدار فوق شكل 
الانتشار٣٠٤)هءء‏ باستخدام أمر واحد مع || ("أنابيب") تشير إلى أنه تم وضع 
الشكلين cles‏ الأمر أدناه تم كتابته في سطرين ولكن يُفترض أن تتم طباعته 
في سطر واحد. 


graph twoway scatter life school, msymbol (Oh) 
|| 1fit life school, lwidth(medthick) 


أخيرأًء إذا كان لدينا خيارات مؤكدة يمكن تطبيقها على الرسم البياني 
ككل» فإن هذه الخيارات يمكن وضعها في نهاية الأمر بعد | الشكل )10.3( 
يوضح ذلكء فالخيار ت Y isk‏ تتضمن فقط ylabel, xlabel, xtick‏ ولكن 
تحدد أيضا بعض التفاصيل حول مربع شرح الرسم البياني "legend‏ 


graph twoway scatter life school, msymbol (Oh) 
|| 1fit life school, lwidth(medthick) 

|| , ylabel(45(5)85) xlabel(2(2)12) 
xtick(1(2)13) x 


legend(col(1) ring(0) position(11)) 
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الشكل (10.3) 


خيار legend‏ في الشكل (10.3) يحدد ثلاثة عناصر هي: 
col)‏ مربع شرح الرسم يُفترض أن يكون في عمود واحدء وبالتالي سوف 
ring(0)‏ مربع شرح الرسم يجب أن يقع داخل منطقة الرسم بدلا من خارجهاء 
فعندما يقع مربع شرح الرسم في خارج الرسم يؤدي إلى ازدحام 
لعناصر البيانات في مساحة صغيرة. 
position(11)‏ وهذا الأمر يضع مربع شرح الرسم في موقع الساعة 11 وهذا ما 
حدث في الرسم أعلاه حيث كان هذا الموضع خال من أي بيانات. 
عملية وضع مربع شرح الرسم داخل الرسم نفسه في جهة خالية من أي' 
بيانات» يُعتبر أفضل طريقة à‏ إذا كنا نستطيع التحكم في «eS‏ ويمكنك اختيار 
ذلك من خلال وضع مربع شرح الرسم حسب الاختيار الافتراضي لبرنامج 
ous ICON‏ موقعه إلى S‏ اکر quas‏ هنا po ats, cols al S‏ 
على خيارات مربع شرح الرسم legend options‏ بطباعة الأمر help twoway‏ 
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options‏ وذلك للتعررف على الخيارات الممكنة للتحكم في موقع مربع شرح 
الرسم ومحتوياته وكيفية ظهوره. 
الشكل (11.3) يحاول التعامل مع هذه الأفكار بوضع ثلاثة أشكال مع 
بعضها. أحد هذه الأشكال الثلاثة من نوع .twoway‏ الخيار 1541 يعني رسم 
الانحدار الخطي مع فترة ثقةء وللقيام بذلك ule‏ أولا تحديد )15 ثم يتم 
وضع شكلي الانتشار فوق خط الانحداروبهذا سوف نرى نقاطا فوق فقرات 
الثقة الرماديةء إذا قمنا بتحديد Mitei‏ في آخر سطر الأمرء فإن فترات AJ‏ 
سوف يتم رسمها فوق بعص النقاط في الرسم البياني النقطي. 
.graph twoway lfitci life school,‏ 
lwidth (medthick)‏ 
scatter life school, msymbol(Th)‏ || 
scatter life school if school»8 & life«55,‏ || 
msymbol(S) mlabel(country)‏ 
ylabel(45(5)85) x1abe1(2(2)12)‏ ,|| 
xtick(1(2)13)‏ 
legend(col(1) ring(0) position(11) label(3‏ 


"Life expectancy") 
order(3 2 1)) 
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الخيار الافتراضي ifitci‏ يعرض فترة الثقة للمتوسط الحسابى الشرطى 
conditional mean‏ للمتغير ya y‏ من عرضه للقيم الفردية Aad gual‏ و 
يشير برنامج ستاتا إلى الخطأ المعياري للمتوسط الشرطي بعبارة "الانحراف 
المعياري للتنبؤ" أو .stdp‏ إذن فالخيار ERE‏ في الشكل (11.3) يعادل 
طباعة الأمر. 
.graph twoway lfitci life school, stdp‏ 
الأخطاء المعيارية للقيم الفردية المتوقعة يمكن وصفها بأنها "الانحراف 
المعياري للتنبؤ" أو cstdf‏ ولمشاهدة عرض أكبر لفترات الثقاة للتوقعات 
الفردية نقوم طباعة الأمر: 
.graph 1:woway lfitci life school, stdf‏ 
الشكلان الآخران في الشكل )11.3( كلاهما رسومات بيانية لشكل 
الانتشار توضح كيف يتم وصف (أو إنشاء رسم بياني مع رموز مختلفة) 
مشاهدات معينة» وقد تم تحديد قيمتين متطرفتين عن طريق إنشاء شكل 
انتشار عادي مع كل البيانات» واختيار مثلثات مجوفة كعلامات لهذه النقاط. 
scatter life school, msymbol (Th)‏ || 
ثم نقوم بوضع الشكل مع شكل الانتشار الثاني (وهو الرسم البياني 
الثالث في الصورة أعلاه) مع استخدام المحدد if‏ لتحديد الدول التي فيها 
متوسط التعليم أكبر من 8 سنوات» ومتوسط العمر المتوقع أكبر من 55 diu‏ 
هناك دولتان فقط في أسفل اليمين تقابل هذه المعاييرء وتم الإشارة إليهما 
ريات dole‏ وك و مها oben‏ الول tae‏ و Buiswans a‏ 
وجنوب أفريقيا South Africa‏ فهاتان الدولتان اللتان يتمتعان بمستوى تعليم 
عالي ولكن مع متوسط عمر متوقع منخفض الأمر الذي جعلهما يبرزان عن 
بقية الدون الأخرى. 


|| scatter life school if school»8 &life«55, 
msymbol(S) mlabel(contry) 


الخيارات العامة في الشكل )11.3( تحدد توصيفات المحور الأفقي x‏ 
وعلامات الرسم» US‏ تتحكم في مربع شرح الرسم» ومرة أخرى نعطي 


144 الإحصاء مع برنامج ستاتا 


لمربع شرح الرسم عموذا واحداء ونضعه في موقع الساعة 11 داخل الرسم 

نفسه؛ وتوصيف المتغير الثالث ر في مربع شرح الرسم هو 'متوسط العمو 
المتوقع" بدلا من التوصيف الأطول والذي يتم استخدامه كخيار افتراضي. 

legend(col(1) ring(0) position(11) label(3 

"Life expectance") 


الخيار legend‏ : ينتهي بالخيار الفرعي )1 2 order(3‏ الذي يحدد بأن 
مربع شرح الرسم يجب أن يتم ترتيبه 1-2-3 وهذا gan‏ بسيطأ كما يظهر 
لأن طريقة ستاتا في فهم الأشكال البيانية الثلاثة المتراكبة في الشكل (11.3) 
تتضمن في الواقع أربعة متغيرات يمكن وضعها في مربع شرح الرسم.ء 
وبإعطاء عدد متسلسل للمتغيرات في الأمر graph twoway‏ هذا يعتبر 
)1( %95 في فترة الثقة» (2) القيم المناسبة أو توقعات الانحدار (ges‏ 
)3( معدل العمر المتوقع في كل الدول للرسم البياني الأول وهو شكل 
الانتشارء (4) معدل العمر المتوقع لكل من بوتسوانا Botswana‏ وجنوب 
أفريقيا South Africa‏ في شكل الانتشار الثاني بواسطة تحديد الخيار 
order(3 2 1)‏ فإننا نحدد Gh‏ يكون هناك مربع.لشرح الرسم البياني في الشكل 
(11.3) وهذا المربع يقوم بترتيب (3) V‏ و(3) Gib‏ و(1) أخيراء تاركا 
الشكل الرابع في الخارج حيث لم تتم الإشارة إليه في الخيار الفرعي 
corder()‏ لذا فإن الخيار الفرعي order()‏ لايتحكم فقط في ترتيب ظهور 
المتغيرات في مربع شرح الرسم ولكن يتحكم Gad‏ في ظهورها. 
مصفوفات شكل الانتشار في الرسم البياني لشكل الانتشار ليست من 
نوع twoway‏ ولا يمكن تركيبها على رسومات أخرىء ولكنها تحتوي على 
رسومات بيانية متعداة يمكن أن تأخذ نفس الرموز النقطية في الرسم» الشكل 
(12.3) يعرض مصفوفة شكل الانتشار لرسومات بيانية تمثل شكل الانتشار 
لخمسة متغيرات في ملف البيانات Nations2.dta‏ 
-graph matrix gdp school adfert chldmort life,‏ 
half msymbol (oh)‏ 


a 
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مصفوفة الانتشار في الرسم البياني لشكل الانتشار تمثل صورة مرئية 
لمصفوفة الارتباط والتي تعتبر مفيدة في حالة تحليل المتغيرات المتعددة؛ 
حيث إنها تعرض ملخصاً للعلاقة بين axe‏ المتغيرات المتشابهة» مما يسمح 
بملاحظة وجود أي علاقات غير خطية أو قيم متطرفة أو الميول العنقودي 
الذي قد يؤثر على النماذج الإحصائية. العلاقات غير الخطية تتضمن متغير 
الناتج المحلي الإجمالي للفرد gdp‏ والذي يظهر بوضوح في الشكل )12.3( 
معطياً تحذيرات حول هذا الميول حيث لا يمكننا رؤية هذا الميول في 
مصفوفة الارتباط وحدها. 

الخيار half‏ يحدد بأن الشكل (12.3)'يجب أن يحتوي على الجزء 
الثلاثى السفلى للمصفوفة فقطء LÍ‏ الجزء الثلاثي العلوي فسوف يتم إهماله 
لتماظه التام 5 الجزء السفلي؛ الخيار msymbol(o)‏ يُسمى الدوائر الصغيرة 
ويُستخدم لوضع دوائر صغيرة كعلامات في شكل الانتشار» ويجب ملاحظة 
أن التحكم في المحاور في هذا النوع من SLAY!‏ يعتبر أكثر تعقيدا بسبب 
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وجود العديد من المتغيرات والمحاور. ولمزيد من التفاصيل عن التحكم في 
المحاور قم بطباعة الأمر -help graph matrix‏ 

ja sally Aga ida Ji ر ا‎ Diae uiia gle ارات‎ el ial aie 
هذا‎ (dà ناحية» وعدة متغيرات تابعة أو متغيرات متأثرة من ناحية أخرىء‎ 
يساعد في عمل قائمة للمتغيرات التابعة التي ظهرت عند استخدام الأمر‎ 
وهذا يؤدي إلى الحصول على رسم بياني متناسق للمتغيرات‎ «graph matrix 
التابعة والمتغيرات المستقلة في الصف السفلي للمصفوفةء فالمتغير الأخير فى‎ 
يمكن تحليله‎ ife الصف السفلي بالشكل )12.3( وهو متوسط العمر المتوقع‎ 
كمتغير تابع في الفصلين (7 و8).‎ 
: الرسومات البيانية الخطية والخطية امنصلة‎ 

Line Plots and Connected-Line Plots 

الرسومات البيانية الخطية المتصلة (graph twoway connect)‏ هي 
syle‏ عن رسومات بيانية لشكل الانتشار تم وصل نقاطها بخطوط أما 
الرسومات البيانية الخطية (graph twoway line)‏ فتقوم بعرض خطوط بدون 
علامات مثلما رأينا في أشكال الانتشار. ولكن كلا النوعين ينتميان لنوع 
graph twoway‏ والتي يمكن تركيبهما ودمجهما في رسم بياني cas y‏ خيارات 
أشكال الانتشار التي تتحكم في توصيف المحاور وعلاماتها تقوم بنفس 
الوظيفة في الرسومات الخطيةء والرسنومات الخطية Ala all‏ وهناك 
خيارات أكثر للتحكم في عرض خط المحور ونمطه ولونه وعدة خصائص 
أخرى. 

الرسومات البيانية الخطية والخطية المتصلةء لها استخدامات أكثر من 
أشكال الانتشارء فمثلاً يمكنها تمثيل التغيرات في متغير ما خلال فترة من 
الزمن. ولشرح هذه الرسومات البيانية» سوف نعود لاستخدام ملف البيانات 
Arctic9.dta‏ و الذي يحتوي على مشاهدات عن call‏ ودرجات الحرارة في 
القطب الشمالي لفترة 33 سنة. 


.use C:\data\arctic9.dta, clear ~~ 
.describe 
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Contains data from c:\data\arctic9.dta 


obs: 33 Arctic September mean sea ice 1979-2011 

vars: 8 2 Jul 2012 06:11 

size: 891 

storage display value 

variable name type format label variable label 

year int Sty Year 
month byte $B.0g 95 Month 

extent float $9.0g Sea ice extent, million km^2 

area float %9.0g Sea ice area, million km^2 

volume float 58 . 09 Sea ice volume, 1000 km^3 
volumehi float %9.0g Volume + 1.35 (uncertainty) 
volumelo float %9.0g Volume - 1.35 (uncertainty) 

tempN float %9.0g Annual air temp anomaly 64N-90N C 





Sorted by: year 


Dal ifl qm gj year stall qua area امير‎ Lak hal) aaa I 

في المنطقة الجليدية بالقطب الشمالي في شهر سبتمبر خلال —) & ولكن 

هناك انخفاضاً غير طبيعي في سنة 2007 على وجه الخصوص (انظر 
الشكل 13.3). 

.graph twoway line area year, 

title("Arctic sea ice, September 1979-2011") 


Arctic sea ice, September 1979-2011 


Sea ice area, million km^2 


1980 1990 2000 2010 
Year 
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الشكل )14.3( يوضح الفترة الزمنية بطريقة AÍ‏ دقة مضيفاً Und‏ ثانياً 
لامتداد الجليد بالبحر exvent‏ (المنطقة المغطاة بالجليد بنسبة %15 على 
الأقل)ء كما تم توصيف المحور الأفقي × بالسنوات من 1980 إلى 2010 
بفرق 5 سنوات بين كل سنة وأخرى (xlable(1980(5)2010)‏ و لکن تم vail‏ 
توصيف المحور الأفقي GY‏ متغيرالسنة واضح ولتوفير مساحة أكبر في 
الرسم» أما المحور العمودي بر يبدأ من الصفر - وهو معدل محتمل وذو 
معنى لبعض المهتمين بالقطب الشمالي - إلى 8 بزيادة قدرها 1 مع خطوط 
شبكة في الرسم تتضمن أقل قيمة وهي 0 وأكبر قيمة وهي 8 وتم توصيف 
القيم بالأمر -ylabel(0(1)8, grid gmin gmax)‏ 


-graph twoway line area extent year, 
xlabel(1980(5)2010) 

xtitle(" ") 

lwidth(medium medthick) lpattern(solid dash) 
legend(row(2) ring(0) position(9) 

label(1 "Area") label(2 "Extent") order (1 2)) 
ylabel(0(1)8, grid gmin gmax) ytitle("Million 
km(superscript:2)") 

title("Arctic sea ice, September 
1979'=char(150) '2011') 


Arctic sea ice, September 1979-2011 


Million km’ 





1980 1985 1990 1995 ' 2000 2005 2010 


ratte 
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المتغير الأول في الشكل )14.3( وهو area‏ تم رسمه بخط ذي عرض 
medium "ago‏ ومتصل .solid‏ المتغير الثاني وهو extent.‏ تم رسمه بخط 
اعرض medthick Wh‏ ومتقطع «dash‏ خيار ax asdegend()‏ التوصيفات 
بمربع شرح pu‏ ويضع المتغير extent‏ أو Y‏ بمربع شرح الرسم ويضع 
المربع بموقع أعلى في الرسم. 

المنطقة الجليدية ومدى هذه المنطقة تم قياسه بمليون متر مربع» والخيار 
ytitle(*Million km {superscript:2}”)‏ يعرض عنوان المصور العمودي 
cie peal i Million ka”‏ تفاضيل أكثر حول Dasani c essit‏ 
بالرسم البياني؛ قم بطباعة 1 chelp graph text‏ كما أن الشكل )7.3( 
ATA Oa yy‏ أخرى عن ذلك. 

طريقة أخرى لتغيير النصوص بالرسم البياني في الشكل )14.3( وهي 
مناسبة أكثر: السنوات 2011-1979 في العنوان يمكن فصلها بعلامة ( 0 
بدلا من علامة ( - )» فالعلامة الأولى هي خاصية افتراضية لا تظهر في 
لوحة المفاتيح» ولكن يمكن تحديدها باستخدام رمز ASCH‏ 150« خيار title‏ 
في الشكل (14.3) تم إدراجه بواسطة ASCH‏ والرمز 150 بين سنة 1979 
وسنة 2011 بواسطة كتابة -char(150)2011‏ 979 لاحظ أنه تم اس تخدام 
علامات التنصيص في يمين السنة الأولى ويسار السنة الثانية. 


الشكل (15.3) يستخدم علامة ( - ) مع رمزين من رموز 45011 في 
aa ul cd ls Galall e jal‏ لاء c] Cae‏ المتخيرين alli‏ الريك 
البياني تم قياسهما بمقاييس مختلفة» ولكن تم وضعهما في رسم بياني واحد. 
فعلى سبيل المثال» قمنا بوضع منحنى لمتغير المنطقة area‏ مع متغير السنة 
year‏ والمنحنى عبارة عن خط متصل (الخيار connect‏ يجمع بين خاصيتين 
هما (lines scatter‏ لدرجة حرارة القطب الشمالي مع: السنة year.‏ كما .أن 
الرسم البياني يوضح أن الجليد في القطب الشمالي يتناقص بنسبب زيادة 
درجة حرارة الهواء في القطب الشمالي. المتغيران يؤثر كلاهما على الآخرء 
ويعكسان تغيرات أكبر ظهرت خارج منطقة القطب الشمالي. 


graph twoway line area year, ylabel(0(1)6) 
yline(0) 


ytitle("Ice area, million km* =char(178)'") 


150 الإحصاء مع برنامج ستاتا 
connect tempN year, yaxis (2) ylabel(-1(1)2,‏ | | 
axis(2)) msymbol (+)‏ 

ytitle("Arctic temperature anomaly, 
'"schar(186)'C", axis(2)) 

||. xlabel(1980(5)2010) xtitle("") 
legend(row(2) ring(0) position(6) 

label(1 "Ice area") label(2 "Temperature") 
order(1 2)) 

title("Arctic September sea ice and annual 
temperature, 

1979^-char(150)'2011", size(medium)) 


Arctic September sea ice and annual temperature, 1979-2011 
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الشكل )15.3( 


في الشكل )15.3( درجة pall‏ )6 السنوية في القطب الشمالي تم تمثيلها 
اکور REDE NINE ETHNIC‏ 
درجات الحرارة تم تمثيلها LÍ (msymbol(+)) 33 5 GLO:‏ مربع شرح 
الرسم تم وضعه في ala‏ الرسم البياني» وبالتحديد في موقع الساعة 
asy caudal‏ المتغيرين في الزسمء وبدلا من اس تخدام {superscript:2}‏ 
لكتابة km?‏ في المحور العمودي بالجهة اليسرى LS)‏ تم سابقا في الشكل 
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3 أما الشكل )15.3( استخدم )550 ASCII‏ والرمز 178 وهو يشبه 
الرمز الذي تم إنشاؤه بالخيار fsuperscript:2)‏ ولكن يظهر بمظهر أفضل 
قليلاء في المحور العمودي بالجانب الأيمن 45011 والرمز 186 يعرض رمز 
درجة الحرارة C‏ 

كت عورف أن 50:569 ول رج وروا لزعو ag‏ ارس 
درجة الحرارة وهكذاء الشكل )16.3( يعرض جدولاً لرموز ASCH‏ والتي 
رسمت بأداة سهلة اسمها casciiplot‏ هذه الأداة ليست جزءًا من برنامج ستاتا 
ولكنها لغة برمجة برنامج ستاتا وتم كتابة البرنامج الذي أنتج الجدول بالشكل 
(16.3) بواسطة عالم الإحصاء الجغرافي نيك ولاس كوكس «Nicholas Cox‏ 
وللحصول على معلومات عن كيفية تنزيل وتحميل وكيفية عمل هذه الأداة 
قم بطباعة الأمر «findit asciiplot‏ ويمكن إنشاء الجدول بطباعة الأمر asciiplot‏ 
والذي يظهر في الشكل (16.3). 

ASCII Code Character Map 


use char(###) function to place symbols into graph text 
1 2 3 4 5 6 7 8 9 
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الشكل )16.3( 


152 الإحصاء مع برنامج ستاتا 





الشكل (15.3) يوضح أبسط طرق الربط connect‏ والتي يمكن 
استخدامها لربط نقاط البيانات بواسطة خط يربط بينهاء الطرق الأخرى 
للربط تم عرض ها أدناهء الخطوط الافتراضية لربط النقاط هي 
connect(direct)‏ أو cconnect(I)‏ ولمزيد من المعلومات قم بطباعة الأمر 
-help connectstyle‏ 


yi connect( )‏ ار الشرح 
١‏ 


i nene‏ لا تربط النقاط 
١ dect‏ (حرف (J!‏ اربط النقاط بخطوط مستقيمة 
L ascending‏ ربط النقاط بطريقة مباشرة فقط في حالة أن [/]»<[1/]: 
J stairstep‏ أفقي ثم عمودي 
(none)  stepstair‏ عمودي ثم أفقي 


Other Twoway Plot Types : «JUI أحرى من الرسم البياني‎ Elgi 


بالإضافة إلى الأنواع الرئيسة للرسم البياني الخطي والنقطي يمكن للامر 
graph twoway‏ رسم عدة أنواع "TES‏ وفي هذا الجزء سوف يتم شرح عدة 
أنواع من الرسومات البيانية الثنائية. وللحصول على قائمة ALIS‏ بهذه الأنواع 
قم بطباعة الأمر -help graph twoway‏ 

في وقت سابق عند إنشاء الشكل (10.3) والشكل (11.3) قمنا باستخدام 
الأمر graph twoway Ifit‏ وذلك لرسم خط الانحدار البسيطء هناك أمر مشابه 
للأمر السابق وهو 56و graph twoway‏ الذي يقوم برسم منحنى الارتباط 
المتعدد من الدرجة الثانية أو التربيعي» الشكل )17.3( يوضح استخدام متغير 
آخر من ملف البيانات Arctic9.dta‏ وهو cvolume‏ وهذا المتغير تم قياسه 
بالكيلو متر المكعب» حيث إن الرمز 9 من ASCII‏ يزودنا برمز المكعب 
في كلمة ckm?‏ ويجب الانتياه إلى أنه من الممكن استخدام -{superscript:3}‏ 


-graph twoway connect volume year, 
ylabel(0(2)16) yline(0) 


ytitle("Volume, thousand km'-char(179)'") 
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| |. afit volume year, lwidth(medthick) 

|| , x1abel(1980(5)2010) xtitle("") 
title("Arctic sea ice, September 
1979^-char(150)'2011") 

legend(row(2) ring(0) position(6) 

label(1 "Volume") label(2 "quadratic fit") 
order(1 2)) 


Arctic sea ice, September 1979-2011 


6 8 10 12 14 16 


Volume, thousand km? 


4 


Volume‏ جه 
quadratic fit‏ 





| 2010 2005 2000 1995 1990 1985 1980 
الشكل )17.3( 
ميول المنحنى التربيعي نحو المحور الأفقي مقتربا من نقطة الصفر 
(yline(0)‏ يؤكد أن متوسط حجم الجليد في شهر سبتمبر انخفظ بشكل مستمرء 
J pall‏ الخطي لن يعطي صورة واضحة عن الهبوط المتسارع وفي بعسض 
الأحيان فإن هذا الميول غير واقعيء المنحنى في الشكل )17.3( يعرض 
ارتفاعاً بسيطأ las‏ خلال السنوات الأولى وإذا توقعنا ما سوف يحدث في 
السنوات القادمة فإننا نتوقع أن خجم الجليد سوف ينخفض لأقل من الصفر؛ 
في الفصل (8) سوف نعود لهذه البيانات: ونأخذ في الاعتبار المنحنى بشكل 
أكثر دقة. | 


154 الإحصاء مع برنامج ستاتا 


الشكل )18.3( jhu‏ للمتغير volume‏ من زاوية مختلفة. ففي هذه المرة 
يستخدم الرسم البياني لمنطقة المدى MON graph twoway rarea‏ بأن 9695 
من حدود عدم التأكد زائد أو ناقص 1.35 ألف fing LS‏ مكعب (دراسة 
(Schweiger et al 2011‏ منطقة المدى أو الأمر rarea‏ يبحث عن متغيرين فى 
المحور العمودي بر. وفي هذا المثال هذان المتغيران هما المتغير volumehi‏ 
والمتغير volumelo.‏ واللذان يحددان الحدود العليا والسفلى لمنطقة معينة ليتم 
uno Qe bal d co alls‏ رو وفيا iue‏ 
(Iwidth(thick))‏ وتم وضع هذا الشكل فوق الرسم البياني الذي يحدد منطقة 
المدى rarea‏ حتى يمكن مشاهدة المنطقة المظللة. 
-graph twoway rarea volumehi volumelo year,‏ 


color(gs13) 


|| line volume year, lwidth(thick) 
lcolor (green) 


||, ylabe1(0(2)18) yline(0) 
ytitle("Volume, thousand km'schar(179)'") 


title("Arctic sea ice, September 
1979'=char (150) '2011") 


legend(row(2) ring(0) position(7) 


label(1 "uncertainty") label(2 "volume") order 
(2 1)) l 


Arctic sea ice, September 1979-2011 
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الأمر graph‏ الذي تم استخدامه في رسم الشكل (18.3) يحدد ألوان خط 
الرسم البياني ولون منطقة المدىء Ld‏ الخيار color(gs13)‏ فهو يعطي منطقة 
المدى اللون الرمادي 13ء وهو أقرب للون الأبيض (gs16)‏ منه للون الأسود 
«(gs0)‏ الرسم البياني الخطي تم وضعه فوق هذا الرسم.ء والخط ذو لون 
أخضر؛ التحكم في الألوان (بدلاً من استخدام اللون الافتراضي) يقوم 
بوظائف محدودة في حالة النشر باللونين الأبيض والأسود ولكنه فعال جداً 
في حالة استخدام عدة ألوان» ولمشاهدة قائمة بالألوان المتوافرة للرسومات 
البيانية في ستاتا قم بطباعة الأمر .help colorstyle‏ 


الشكل )19.3( يضع شكلين من النوع الثنائي لإنشاء صورة مختلفة من 
نفس المعلومات الخاصة بحجم الجليد في القطب الشمالي. في هذا الشكل 
البياني المتغير volume‏ تم تمثيله بأعمدة loin graph twoway bar‏ مدى عدم 
cb SEN‏ كر ورين ss aoka Anda‏ فاون Gs (Cates)‏ سبق 
أن شاهدناه في الشكل )18,3( الأعمدة تم تلوينها Osh‏ رمادي خفيف 
«(color(gs10))‏ ويجب ملاحظة أن الشكل )18.3( وضع خط المتغير volume‏ 
فوق منطقة مدى عدم التأكدء بينما وضع الشكل (19.3) الرؤوس المدببة التي 
تمثل مدى عدم التأكد في أعلى الأعمدة البيانية التي تمثل المتغير «volume‏ 
can jill‏ في الشكلين مطلوب» حتى نستطيع مشاهدة الشكل بوضوح» ويمكنك 
اختبار ذلك مع أوامر مشابهة لمشاهدة كيفية عمل تلك الأوامر. 


.graph twoway bar volume year, color(gs10) 

|| rspike volumehi volumelo year, 

 lwidth(medthick) 

|| , ytitle("Volume, thousand km'-char(179)'") 

title("Arctic sea ice, September 
1979"zchar(150)'2011") 

legend(row(2) ring(0) position(7) 

label(1 "Volume") label(2 "uncertainty")) 
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الشكل )19.3( 


لا يجب الخلط بين الرسم البياني الثنائي المضلع graph twoway bar‏ 
والمضلع التكراري» Cus‏ يوجد اختلاف بين الأمرين» فالأمر twoway bar‏ يقوم 
ببساطة بإنشاء رسم بياني للمتغير رمع المتغير × مفترضا أن المتغيرين تم 
قياسهما بوحدات قياس مختلفة» ولكنهما يشتركان في خاصيات متعددة Js‏ 
توصيف المحورين الأفقي والعمودي» واحتمالية وضع الرسومات فوق بعضها. 

ستاتا يوفر أكثر من 40 baa le gi‏ من أنواع الرسم البياني الثنائي 
Y graph twoway‏ يسع المجال لذكرها هنا. في الفصول E A alal‏ 
نشرح lel gil‏ أخرى من هذه الرسومات؛ وللحصول على قائمة كاملة 
yal WL:‏ الخاصة بهذه الرسومات وتركيباتهاء قم بطباعة الأمر help graph‏ 
-twoway‏ 


Bar Charts and Pie Charts : الرسومات البيانية العصودية والدائرية‎ 


الأمر graph bar‏ یختلف عن الأمر Cus «graph twoway bar‏ إن الأول 
يعرض العلاقات التي تتضمن نوعا واحدا أو أكثر من المتغيرات المصنفة 
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مثل هذه الأشكال البيانية تبرهن بشكل خاص على أهمية بيانات الدراسات 
الاستقصائية» كما سوف يتم عرضه في Jail‏ (4). هذا الجزء يعتبر 
كمقدمة لهذا الأمر مع أمثلة باس تخدام متغيرات من ملف بيانات 
Nations 2.dta‏ 


.use C:\data\Nations2.dta, clear 
.describe region gdp pop 





Storage display value 
variable name type format label variable label 
region byte %8.0g region Region 
gdp float %9.0g Gross domestic product per cap 20055, 2006/2009 
pop float %9.0g Population 2005/2010 


المتغير ies gdp‏ الناتج المحلي الإجمالي للفرد. وقيمه تتراوح بين 
الأفقي أو العمودي أمر غير عمليء لذلك سوف fas‏ بإنشاء متغير جديد باسم 
0 يوضح الناتج المحلي الإجمالي GYL‏ الدولاراتء الشكل )20.3( 
يعرض المتوسط والمنوال للمتغير gdp1000‏ للقارات region‏ باستخدام الرسم 
البياني العمودي -graph bar‏ 


generate gdp1000 = gdp/1000 
. summarize gdp gdp1000 





Variable Obs Mean Std. Dev. Min Max 
gdp 179 12118.74 13942.34 279.8 74906 
gdp1000 179 12.11874 13.94234 .2798 74.906 


.graph bar (mean) 90351000 (median) gdp1000, 
over (region) 


ytitle("Per capita GDP, thousands of 2005 US 
dollars") 


blabel (bar, format (%3.1£) ). 
bar(1, color(blue)) bar(2, color(orange) ) 


legend(ring(0) position(11) col(2) label(1 
"Mean" ) 


label(2 "Median") symxsize(*.5)) 
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الشكل (20.3) يتضمن توصيفات تظهر في أعلى الأعمدة بالرسم 
البيانئي» ويعرض تنسيقات للأرقام cformat(993.1f)‏ والذي يعني تنسيقات 
ثابتة مع ثلاثة أرقا أحدها على يمين الفاصلة العشرية؛ والأعمدة يمكنها 
ليس فقط عرض المتوسطات أو المنوال وإنما La‏ عرض عدد من 
الحسابات الإحصائية الأخرى مثل النسب المئوية» وأعلى قيمةء وأقل قيمة 
والأعداد. كما يمكنها أيضاً أن تعرض هذه الإحصائيات لأكثر من متغير 
واحد إذا تشابهت وحدة قياس هذه المتغيرات. 

مربع شرح الرسم في الشكل )20.3( يظهر في داخل الرسم نفسه في 
ناحية البيانات بموقع الساعة 11: ring(0) position(11)‏ وبه عمودان 
متوازيان Las‏ إلى جنب» LÍ‏ الخيار symxsize(*.5)‏ يجعل حجم الرموز في 
المحور الأفقي في مربع شرح الرسم تظهر بنصف حجمها الافتراضيء وذلك 
لتوفير مساحة فير الرسم. كما يجعل الرموز أكثر تشابها مع حجم الأعمدة 
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الرسم البياني العمودي graph bar‏ في المثال أعلاه» يحدد اللون الأزرق 
للعمود ٠1‏ واللون البرتقالي للعمود 2. اللونان الأزرق والبرتقالي قد لا 
يظهران في هذه الصفحة بسبب الطباعة باللونين الأبيض get, ciscus‏ 
الاختلاف login‏ واضح» وكما أشار نيكو لاس كوكس o3 Nicholas Cox‏ 
اللونين الأزرق والبرتقالي من الألوان التي تلفت الانتباهء لأنها تظهر اختلافاً 
Loa‏ و اكا للغار ف عن us ay call cali‏ فين فك تف عدن 
الأحمر والأخضر. المحللون ربما يأخذون هذه الاختلافات في الاعتبار عند 
تصميم الرسومات البيانية Lapai‏ عندما تكون التفرقة بين الألوان أمرًا في 
غاية الأهمية. 

الرسومات البيانية العمودية يمكنها توفير شرح واضح للعلاقات 
المتداخلة بين العديد من الفئات وعند وجود متغيرين أو أكثر. ومن ناحية 
أخرى» فإن الرسم البياني الدائري نادرأ ما يوضتح التحليل» ولكنه شائع في 
بعض المحاضرات العامة؛ إلشكل )21.3( يشرح أمر إنشاء الرسم البياني 
الدائري aac ius graph pie‏ السكان لكل قارة؛ فالمتغير pop‏ يمتد من أقل 
من 10,000 إلى 1.32 مليار نسمة 132e)‏ يعني *10 x‏ 1.32 = 
0 2 اولإنشاء رسم بياني دائري سهل القراءةء فإنه من 
الإفضل إنشاء متغير جديد popmil ea‏ أو عدد السكان بالمليون نسمة. 


.gen popmil-pop/1000000 
. summarize pop popmil 





Variable Obs Mean Std. Dev. Min Max 
pop 194 3.44e«07 1.31e+08 9767 1.32e«09 
popmil 194 34.37752 131.4004 .009767 1324.696 


-graph pie popmil, over(region) pie(2, explode) 
plabel( all sum, format(?:4.0f)) 

title("World population in millions, by 
region") 

legend(col(1) position(9)) 
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World population in millions, by region 
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الخيار pie(2,explode)‏ يقوم بإبراز الشريحة الثانية (Americans)‏ خار 5 
للتأكيد على أهميتهاء أما الخيار plabel( all sum, format(%4. 0f)‏ يحدد 
توصيفات لكل الفئات بالشكل الدائري Lua‏ مجموع المتغير popmil‏ 
(مجموع عدد السكان بالمليون نسمة) لكل منطقة» أما توصيفات الرسم البياني 
الدائري تم تنسيقها بالأمر Gilly format(%4.0)‏ يعني aad‏ رامنا ثابت مع 
أربعة أرقام بدون وجود أي أرقام بعد الفاصلة. 

لمشاهدة كل الخيارات المتوافرة مع الرسم البياني الدائري» قم بطباعة 
الأمر help graph pie‏ حيث إن الخيارات تتضمن الطرق المختلفة لتنظيم 
البيانات»ء أحد الخيارات المثيرة هو 0رط والذي يقوم بإنشاء صورة تحتوي 
على Aaa cla ga)‏ متعددة يمكن :مشا هذثها و المقارتة gigs‏ 


الرسم البياني olus)‏ والرسم البياني GU‏ : 
Symmetry and Quantile Plots‏ 
رسم الصندوق» والرسم البياني العموديء والمدرج «s ) JS‏ تلخص 
توزيع قياس المتغيرات» ولكنها لا توضح نقاطا مهمة بالبيانات» فهي عبارة 
عن نظرة ale‏ على البيانات ككل. ومن ناحية gyal‏ فإن الرسم البياني 
للربيعات» والرسم البياني التناظري» يتضمنان نقاطاً لكل مشاهدة. فالقارئ 
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يحتاج إلى مجهود ASÍ‏ لقراءتهماء لأنهما يعرضان تفاصيل AS‏ من تلك 
التفاصيل التي يعرضها الرسم البياني العمودي» والمدرج التكراري. 

المدرج التكراري لنسبة الإناث إلى الذكور في القوى العاملة ل 177 
دولة الموجودة في ملف البيانات —Nations2.dta‏ والتي تظهر في الشكل 
(22.3) تم تركيبها فوق منحنى التوزيع الطبيعي (توزيع جاوس) الذي يشير 
إلى أن المتغير emab‏ (الذي يمثل نسبة الإناث في القوى العاملة) له ذيل 
أكثر من الطبيعي إلى جهة lull‏ (الدول التي بها عدد إناث أقل في القوى 
العاملة) وذيل أقل من الطبيعي جهة اليمين وهذا يعني وجود التواء سالب. 


.histogram femlab, norm percent 


20 


15 





4 6 8 
Female/male ratio in labor force 2005/2009 


الشكل )22.3( 


الشكل )23.3( يعرض هذا التوزيع في رسم بياني تناظري موضحا 
المسافة بين المشاهدة ith‏ التي تقع أعلى من الوسيط (العمودي) والمشاهدة ith‏ 
التي تقع تحت الوسيط. كل long ine (IS ca gd Ll‏ على الخط 
المحوري لو كان التوزيع تناظرياً. ولكننا نرى وجود مسافة تحت الوسيطء 

وهذه المسافة تزداد بمقدار أكبر مشيرة إلى التواء calla‏ 
.Symplot femlab‏ 
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مك 


Female/male ratio in labor force 2005/2009 


Distance above median 





2 : 
Distance below median 


الشكل )23.3( 


الربيعات هي القيم التي تظهر في أسفل مستوى معين من البيانات. فمثلاً 
الربيع 0.3« هو عبارة عن القيم ASI‏ من %30 من البيانات (تشبه 
ال 7630( وإذا قمنا بترتيب عدد المشاهدات ” تصاعدياء فإن قيمة المشاهدة 
ith‏ تمثل الربيع ”/(5-)» والرسم البياني للربيعات يقوم آليا بحساب جزء 
المشاهدات الذي تقع تحت كل قيمة في البيانات» ويعرض النتائج برسم بياني 
في الشكل )24.3( والرسم البياني للربيعات يعتبر مرجعا لأي شخص ليس 
لديه البيانات الأصليةء ومن خلال التوصيفات الموجودة بالرسم البياني. 
يمكننا تقدير بعض الحسابات الإحصائية مثل الوسيط (الر بيع 0.5) أو 
العشيرات (الربيعات 0.1( 0.2( 0.3 وهكذا) كما يمكننا أيضا قراءة الرسم 
البياني للربيعات لتقدير جزء المشاهدات التي تقع تحت قيمة محددة 

معطاة. 
.quantile femlab, xlabel(0(.1)1,grid)‏ 
ylabel(.2(.1)1,grid)‏ 


or sl 
e 
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Fraction of the data 
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الرسومات البيانية للربيعات العادية تسمى Lai‏ الرسومات البيانية 
للاحتمال الطبيعي» التي تقارن بين توزيع متغير ما مع ربيعات توزيع 
طبيعي نظري له نفس المتوسط والانحراف المعياري» هذه الرسومات تسمح 
لنا بإجراء فحص نظري للانحراف عن التوزيع الطبيعي لكل جزء من 
التوزيع» والذي يمكن أن يساعد كدليل في اتخاذ القرارات التي تتعلق 
بالافتراضات الطبيعية والجهود التي تحاول جعل التحول طبيعيا أكثر. الرسم 
البياني للربيعات العادية بالشكل )3 .5) للمتغير femlab‏ يؤكد Gl‏ الالتواء 
السالب والذي سبق ملاحظته سابقاء والخيار grid‏ يقوم بإنشاء خطوط 
شبكة ل 10.05 10.10 0.25 (الربيع الأول) و0.50 (الوسيط) 5 0.75 
(الربيع الثالث) والربيعات 0.90 و0.95 cles j sill‏ قيم الربيعات 0.05 
و0.50 و0.95 تم عرضها في أعلى ويمين المحاور. 


.qnorm femlab, grid 
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Inverse Normal 
Grid lines are 5, 10, 25, 50, 75, 90, and 95 percentiles 
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إصافة نص للرسومانت البيبانية : Adding Text to Graphs‏ 
يمكن إضافة عناوين وشروحات وملاحظات للرسم البياني لجعله أكثر 
eer‏ ففى الشكل الافتراضي العناوين ن الرئيسة والعناوين ن الفرعية تظهر 
فرق «منطفة رات اتن روما توق ق مصدر البيانات (Ds‏ ومربع شرح 
a‏ ل a‏ انظر الشكل ET‏ 
فمثلاً للحصول على معلومات is‏ عن cs‏ العناوين» HS TENE‏ 
title options‏ ماعطء وعن خيارات تغيير المحتويات مثل حجم الخط ولونه قم 

بطباعة الأمر -help textbox options‏ 
كما أنه من الممكن إضافة مربعات نصيّة في مواقع محددة داخل 
منطقة الرسم نفسه. فعلى سبيل المثال. ردما نريد إضافة ملاحظة في 
رسم بياني ASIA.‏ زمنية مثل تواريخ دوبان الجليد في دحيرة وينبيسوكي 

.)26.3( تم الإشارة إليها في الشكل‎ GS Lake Winnipesaukec 
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-use C:\data\lakesunwin.dta, clear 


a 
.describe 
Contains data from c: dataVlakesunwin.dta 
obs: 144 Sunapee & Winnipesaukee ice out 1869-2012 
vars: 5 4 Jul 2012 11:21 
size: 1,728 
storage display value 
variable name type format label variable label 
year int sty * Year 
Sunedate float %tdCymd Date Lake Sunapee Ice-Out 
sunout inc $9.0g Lake Sunapee Ice-Out day 
winedate inc £tdCYmd Lake Winnipesaukee Ice-Out 
winout int $9.0g Lake Winnipesaukee Ice-Out day 


Sorted by: year 


.graph twoway line winoutyear 

|| lowess winout year, lwidth(medthick) 

| | if year>=1887 , xlabel(1890(10)2010) 
legend(off) xtitle("") 

ytitle("Ice Out day of year") 

text(87 1905 "Early 20th century" "warming") 
text(130 1950 "Mid-century cooling" "(global 
dimming)", 

box margin(small) bcolor(gs11)) 

text(125 1998 "Mode:n rapid" "warming", 
justification(left)) 


5 Mid-century colling . 
me * (global dimming) 
Modern rapid 
warming 
& 
3 
ie n M ul "n h t 
E H T n Ll 
F انالا‎ 
zS | 
3 
Early 20th century 
warming 
Su. 


1896 .500 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 2010 
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الرسم البياني المبسط في الشكل )26.3( من نوع twoway line‏ يمثل all‏ 
ذوبان الجليد في بحيرة Winnipesaukee‏ للفترة من سنة 1887 إلى 2012ء تم 
وضع شكل بياني ثان يعرض منحنى انحدار 65 ثم رسمه بخط متوسط 
العرض (Iwidth(medthick))‏ ليكون أكثر وضو ix‏ 0 انحدار القطع التمهيدي — 
سوف يتم شرحه في الفصل )8( TOM OW EN CON TE‏ 
البيانات» وله Ul je dae‏ تجعله أفضل من طرق المتوسط «em pall‏ أما منحنى 
القطع التمهيدي في الشكل )26.3( يوضح اتجاهات عدة عقود التي تكمن 
وراء التغيرات التي حدثت من سنة لأخرى 

الاتجاهات خلال عقود في وضع البحيرة تتبع بشكل عام نفس نمط 
درجات الحرارة العالميةء وبيانات ولاية نيوهامبشير خلال نفس الفترة التي 
تم شرحها في دراسة )20102 «(Hamilton et al.‏ أما تواريخ ذوبان الجليدء فقد 
شهدت انخفاضاً Lle‏ خلال فترة ارتفاع درجات الحرارة في نهاية القرن 19 
وبداية القرن 20» وكان هناك انخفاض بسيط في درجات الحرارة خلال 
الفترة من الأربعينيات إلى بداية السبعينيات» مما أدى إلى تغير في تواريخ 
ذوبان الجليد. Gale‏ فإن هذه الفترة تمشل المرحلة التي كانت تصل 
led‏ أشعة الشمسن آل سطع cd‏ يندت ارت الصناعي حسب دراسة 
(Wild et al. 2007(‏ وخلال فترة زيادة درجة الحرارة والتي كانت ما بعد 
منتصف السبعينيات كانت تواريخ ذوبان الجليد في بحيرة Winnepesaukee‏ قد 
نقصت بدرجة كبيرة» Gus‏ إن Gash‏ بيانات مسجلة لتواريخ ذوبان الجليد 
كانت في سنة 2010 وسنة 2012. 

ثلاثة مربعات شرح نصية تم وضعها في منطقة البيانات بالشكل 
)26.3( توضح التغيرات المناخية. حيث يحتوي كل مربع على سطرين» تم 
الفصل بينهما بواسطة الخيار text)‏ مع علامتي اقتباس» فالخيارات text()‏ 
تحدد مربعات شرح الرسم البياني والتي عادة ما تحتاج إلى اختبار تحديد 
موقعها بالضبط؛ فمربع شرح الرسم الأول تم إنشاؤه بالأمر: 

text(87 1905 "Early 20th century" "warming") 
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حيث يقوم بوضع مربع الشرح في x71905 5 y=87 ei gall‏ مع استخدام 

o-1950 5‏ حيث يُعرض محاطا بحدود يمكن مشاهدتها بوضوح مع هامش 

صغير small‏ حول النص» Ld‏ ألوان الحدود والخلفية فيتم تحديدها بلون 
رمادي 61 

text(130 1950 "Mid-century colling" "(global 

dimming)", 

box margin(small) bcolor(gs11)) 

text(125 1998 "Modern rapid" "warming", 

justification(left) ) 


وللحصول على مزيد من المعلومات حول التحكم في مربعات الشرح 


help colorstyle والأمر‎ help textbox options النصية يمكنك طباعة الأمر‎ 


: Do-Files همك ملفات التلفيد‎ ll الرسم‎ 
Graphing with Do-Files 


الأشكال البيانية المعقدة مثل الشكل )26.3( تتطلب أسطر أوامر graph‏ 
طويلة (بالرغم من أن ستاتا يعرض الأمر بالكامل في سطر واحد)» ملفات 
التنفيذ Do-Files‏ - التي تم شرحها في الفصل (2) - تساعد في كتابة الأوامر 
ذات الأسطر المتعددة؛ كما أنها تسهل حفظ الأمرء وإعادة استخدامه مستقبلا 
في حالة الحاجة لتعديل الرسم البياني أو رسمه من جديد. 


الأوامر التالية تم طباعتها في محرر 120-7116» وحفظها في ملف aul‏ 
Cus » fig03_26.do‏ إنها تمثل ملفا جديدا لرسم الشكل )26.3( من جديد. 


use C:\data\lakesunwin.dta, clear 

-graph twoway line winout year /// 

|| lowess winout year, lwidth(medthick) /// 

B if year>=1887 , xlabel(1890(10)2010) legend (off) 
xtitle("") /// 

ytitle("Ice Out day of year") /// 

v 1905 "Early 20th century" "warming") 
// 

text(130 1950 "Mid-century cooling" "(global 
dimming)", /// 
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box margin(small) bcolor(gs11)) /// 

text(125 1998 "Modern rapid" "warming", /// 
justification(left)) 

-graph save Graph C:\graphs\fig03_26.gph, 
replace 

.graph export C:\graphs\fig03_26.png, as(png) 
replace 

.graph export C:\graphs\fig03_26.eps, as(eps) 
replace 


عندما ينتهي السطر بعلامات /// في الملف التنفيذي 40-81 فإن ذلك 
يعني أن الأمر لم يكتمل بعد ومازال مستمرا في السطر التالي. والأمر يتم 
تنفيذه فقط عندما لا تحتوي نهاية السطر على ///» أماالطريقة الأخرى لكتابة 
الأوامر ذات الأسطر المتعددة فتتم باستخدام الأمر #delimit;‏ والذي يقوم 
بتحديد نهاية الأمر باستخدام فاصلة منقوطة Yay‏ من النهاية الافتراضية 
وهي ضغط مفتاح Enter‏ أو استخدام (#delimit cr)‏ التي سبق شرحها في 
الفصل (2). 
الأمر TI graph save Graph‏ بحفظ الصورة أو الرسم البياني (والتي 
يتم إعطاؤها lad‏ افتر "Graph" Us ga Laal‏ والتي تظهر في نافذة الرسم 
(Graph window‏ بتنسيق ستاتا الذي ينتهي بالامتداد gph‏ كما يمكننا تحديد اسم 
مؤقت لأي رسم بياني وذلك بإضافة خيارات أخرى للأمر Jia graph‏ خيار 
name(newgraph)‏ أو خيار 2 sname(fig03_‏ استخدام مثل هذه الأسماء 
المؤقتة للرسومات البيانية يُعتبر أمرا مهما fas‏ عندما يكون لدينا مجموعة 
من الرسومات البيانية المعروضةء ونريد حفظ أو طباعة أحدهاء كمسا أن 
إعطاء اسم مؤقت للرسم البياني الذي قمنا بإنشائه لا يعني حفظه في Qe ill‏ 
وليس من الضروري تطابق أسماء الملفات المؤقتة والمحفوظةء وللحصول 
على معلومات أكثر عن خيارات الحفظ قم بطباعة الأمر -help name option‏ 
الأمر graph export‏ الموجود بالملف do-file‏ يقوم بإنشاء إصدار ثان 
وثالت لنفس الرسم البياني بتنسيقات مختافة. فالملفات ذات التنسيق (png)‏ 
تعتبر صور) نقطية ولها دة ثابتة وقابلة للاستخدام مع برامج idi‏ وبمك 
مشاركتها من خلال صفحات cus‏ ومايكروسوف بوربوينت وغيرها مسن 
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التطبيقات. أما الملفات ذات التنسيق (eps)‏ فهي GIS‏ جودة عالية وتنسيقاتها 
مفضلة في النشرء ولمعرفة المزيد عن الخيارات الأخرى. dl Xa‏ طباعة 
-help graph export E‏ 


عند حفظ أوامر إنشاء وحفظ الرسومات البيانية في 
fig03_26.do‏ يمكن تطبيق أوامر هذا الملف بطباعة الأمر التالي: 

.do fig03 26 

الأمر أعلاه سوف يقوم بتنفيذ كل الأوامر التي يحتويها اله لف التنفيذيء 

Cus‏ سيقوم بإنشاء الرسم البياني وحفظه في ثلاثة تنسيقات مذتلفة» وسوف 

يتم الحفظ فوق الملفات الموجود مسبقا. 


استعاده $39 الرسومان البيانية : 


Retrieving and Combining Graphs 


أي رسم بياني مخزن ببرنامج ستاتا بتنسيق امع يمكن اس تعادته في 
ذاكرة الجهاز باستخدام الأمر: .graph use‏ فعلى سبيل المتالء يمكننا استعادة 
-graph use fig03 26.gph‏ 
عندما يظهر الرسم البياني في ذاكرة الحاسب» فإنه يُعرض على الشاشة 
ويمكن طباعته أو حفظه مرة أخرى باسم مختلف أو بامتداد مختلف, فمثلا |j‏ 
كان لدينا رسم بياني تم حفظه سابقا بامتداد امع يمكننا إعادة حفظه باستخدام 
امتدادات « ختلفة .eos, .png, emf (Ba‏ كما أنه من الممكن تغيير لون الرسم 
باستخدام قوائم ستاتا أو باس تخدام الأمر "Y ad -graph use‏ الملف 
fig05 26.gph‏ الذي تم حفظه BR‏ كانت ألوانه بتنسيق «s2color‏ ولكن يمكننا 
أن نرى كيف يظهر الشكل البياني باستخدام تنسيق الالو -s2monochrome (jl‏ 
(وهي بديل للخطوط المتقطعة بعدة ألوان) وذلك بطباعة الأمر: 
.graph use fig03_45.gph, scheme (s2mono)‏ 
الرسومات البيانية المخزتة على القرص الصلب يمكن دمجها باس تخدام 
الأمر graph. combine‏ بحيث يمكن عرض عدة رسومات بيانية في نفس 
الإطار. 
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ملف التنفيذ do-file‏ أدناه (تم حفظه باسم fig03_27.do‏ ثم أعيد تشغيله 
بطباعة الأمر 5803_27 (do‏ يدمج الشكل )17.3( والشكل )18.3( والشكل 
)19.3( والتي تم إنشاؤها في هذا الفصل» وجود // يشير إلى استمرارية 
الأمر في السطر التالي. والشكل النهائي الذي يظهر الرسومات المدمجة تم 
حفظه وإعطاؤه اسم الشكل (27.3). 


.graph combine /// 

C: \A_books\SwS_12\graphs\fig03_17.gph /// 
C:\A_books\SwS_12\graphs\fig03_18.gph /// 
C:\A_books\SwS_12\graphs\fig03_19.gph ///, 
rows(2) altshrink /// 

title("Combining Figures 3.17-19", 
size(medium)) 

-graph save Graph C:\graphs\fig03_27.gph, 
replace 

-graph export C:\graphs\fig03_27.emf, as(emf) 
replace 


Combining Figures 3.17-19 


Arclic sea ice, September 1972-2011 Arctic sea ice, September 1979-2011 
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الشكل )27.3( 
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الخيار trows(2)‏ يحدد أن الشكل (27.3) يجب أن يتم ترتيبه في شكل 
بياني فرعي في صفين etl‏ كما أنه من الممكن تحديد الخيار 
col(2).altshrink‏ والذي يحدد تتابع النصوص في كل شكل بياني صغير في 
الشكل البياني (27.3) ويجب ملاحظة أنه بالإمكان وضع عنوان عام (أو 
ملاحظة أو شرح أو عناوين للمحاور.. الخ) للشكل البياني «JSS‏ ولكن y‏ 
يمكننا إجراء تغيير جوهري في محتويات الأشكال الفرعية الصغيرة بالرسم 
البياني. 


محرر الرسم البياني : Graph Editor‏ 


محرر الرسم البياني Graph Editor‏ يتيح لنا تعديل شكل الرسم البياني 
a ga gal‏ جاليا في الذاكرة GIS Sl gan‏ هذا JSAM‏ كدتثم إنشاؤة الآن. أو سبق 
حفظه من قبل وتم استعادته باستخدام الأمر «graph. use‏ إنه من الأسهل أن 
تعرف معلومات حول خاصية تحرير الرسم بالتدريب عليها واختبارها الآن 
a‏ من الاطلاع عليها نظرياً فقطء فمثلا إذا كنا نريد القيام ببعض التغييرات 
في الشكل (18.3) نبدأ أولا باستعادة هذا الشكل باستخدام الأمر: 
.graph use C:\graphs\fig03_18.gph‏ 
في نافذة الرسم البياني Graph Window‏ اختر File » Start Graph‏ 
Eidtor‏ أو اضغط على أيقونة تحرير الرسم البياني ad‏ سوف يتغير مظهر 
نافذة الرسم حيث سيظهر شريط أدوات في الهامش الأيسر للنافذة ومتصفح 
لعناصر الرسم في الجانب الأيمن» كما يظهر في الشكل )28.3( شريط 
أدوات يحتوي على أداة المؤشر لاختيار أجزاء من الرسم البياني وأدوات 
أخرى لإضافة نصوص أو dash‏ كما يمكن تحرير خطوط شبكة الرسم 
البياني» ويعرض متصفح عناصر الرسم قائمة لمحتويات الرسم البياني 
وتظهر علامة + بجانب بعض العناصر وبإلنقر على علامة + سوف تتومتع 
القائمة لتعرض عناصر أخرى داخلهاء ويمكننا اختيار أي عنصر بالنقر عليه 
أو النقر على اسم العنصر في المتصفح في يمين النافذة (وهو الأسهل في 
الرسومات البيانية المعقدة). 
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الشكل )28.3( 


في الرسم “Ploti” gta)‏ 2 يشير إلى ناحية الرسم twoway rarea‏ وهو 
تنسيق المنطقة الرمادية التي تمثل مدى الخطأء والنقر على النطاق الرمادي 
)3 النقر على plot!‏ تحت القائمة plotregionl‏ بالمتصفح) لاختيارها سوف 
يتم تنشيط 210:1 في قائمة المتصفح» وفي الرسم البياني نفسه. إن عملية 
اختيار أي عنصر في الرسم سوف يفتح شريط أدوات علائقي فوق الرسم 
البياني مباشرة» وهذا الشريط يعطي معلومات عن خصائص العنصر الذي تم 
Pere‏ 
وفي هذا المثال يمكننا رؤية أن plot!‏ منطقة المدى الملونة باللون 
الرمادي 13 Gray‏ وهو داكن بنسبة %80 وذو عرض متوسطء إذا قمنا بالنقر 
على More...‏ في فى شريط الأذوات العلائقي» يمكننا الحصول على خيارات 
أكثر للتحكم في كصائص العنصر الذي تم اختياره. 
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الشكل )29.3( 

تغيير نوع الرسم البياني plottype‏ من Rarea‏ (منطقة المدى) إلى Reap‏ 
(منطقة مخططة) واللون من 3 Gray‏ إلى 13 Gray‏ (داكن أكثر) وعرض خط 
الرسم من Medium‏ إلى Medium thick‏ سوف يعطي الرسم شكلا جديدا 
(الشكل 30.3). 
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الشكل )30.3( 
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في الرسم البياني 2 يشير إلى خط الرسم البياني twoway line‏ والذي 
تم تركيبه على المنحنى الرئيس في الشكل )18.3( إذا قمنا باختيار plot2‏ 
في متصفح عناصر الرسم البياني Graph Editor‏ الموجود في الجانب الأيمن 
للنافذة» ثم قمنا بتغيير نوع الرسم plottype‏ من Line‏ إلى Scatter‏ واللون إلى 
Gray 5‏ سوف نحصل على الشكل )29.3( الرسم البياني النهائي يتضمن 
NM‏ مع عبارة significantly lower"‏ 2010“ تم إضافتها بواسطة استخدام أداة 
T‏ (نص) وأداة السهم» وهما من ضمن الأدوات الموجودة في شريط الأدوات 
بالجانب الأيسر للنافذة. 
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الشكل )31.3( 


Lagat‏ فإن نافذة محرر الرسم البياني Graph Editor‏ لها خاصية تعديل 
الرسم البياني بعدة طرق يمكن التحكم بها باستخدام الأمر الأصلي «graph‏ 
ولكن لا يمكننا عمل بعض الأشياء الأخرى مثل نقل نقطة بيانات معينة في 
الرسم بالرغم Ge‏ أنه يمكننا إضافة أو حذف علامات جديدة في أي موضع 
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eos. oai as: ugs ا هذا‎ dli کی‎ AS Gag cual 
إخفاء عناصر في‎ Laf يمكننا‎ LS والخطوط وتوصيف المحاور والعناوين»‎ 
الرسم البياني وجعلها غير مرئيةء ويجب ملاحظة أن أي تغييرات في نافذة‎ 
تصبح دائمة عند حفظها.‎ Graph Editor محرر الرسم البياني‎ 

أبداعات ي الرسم البيائي : Creative Graphing‏ 


الكاتب Edward Tufte‏ في كتبه المؤثرة والرائعة حول التمثيل البياني 
cuu‏ )1990« 1997« 2001« 2006( نصح بوضع مجه ٫دات‏ أكبر عند 
تصميم أي رسومات بيانية لتمثيل أي نوع من البيانات. يعتق د الكاتب أن 
عرض تصميمات رائعة وواضحة» يعطي للقارئ مساحة للمقارنة» وفحص 
العلاقات بين مختلف المتغيرات» فمستخدمو برنامج ستاتا هم أناس عاديونء 
وستاتا يوفر مجموعة من الأدوات المرنة للتمثيل المرئي للبيانات المعقدة مما 
يسمح بتطوير الرسومات البيانية البسيطة أو إعادة تنظيمها بشكل جمالي أكثر 
لتظهر بأشكال dane‏ 
أحد الموضوعات التي تناولها Edward Tufte‏ هو قيمة المضاعفات 
الصغيرةء» وهي عبارة عن مجموعة من الرسومات البيانية الصغيرة l‏ 
تدمج في شكل واحد لتسهيل عملية المقارنة» فالأمر graph‏ مع الخيار byO‏ 
يمكنه إنشاء he‏ هذه الأشكال بطريقة رائعة» الشكل )32.3( يوضح بيانياً 
عمق الثلوج في فصل الشتاء خلال فترة زمنية معينة لمنطقتين الأولى هي 
قرية في الجبال البيضاء بولاية نير هامبشير بالولايات المتحدة والثانية مدينة 
بوسطون التي تبعد 225 كيلومترا DRM‏ (البيانات بالملف «(whitemtl. dta‏ 
عمق انتلوج تم قياسه على أساس يومي في المنطقتين» وهذه البيانات تغطي 
تسعة فصول شتاء متتابعة في الفترة من شتاء 1998-1997 إلى شتاء 
2006-2005 والمتغير dayseason‏ يقوم بعد الأيام من 1 نوفمبر لكل فصل 
شتاءء و المتغير ان midepth‏ و bosdepth‏ يقيسان عمق الثلو € بالسنتيمتر في كل 
من الجبال البيضاء ومدينة بوسطون على التوالي» المتغير season‏ يحدد 
فصول الشتاء للفترة من 1998-1997 إلى الفقترة 12006-2005 باتباع 
الأمر twoway area‏ نقوم بإنشاء رسم بياني للمتغيرين midepth‏ و bosdepth‏ 
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مع المتغير dayseason‏ ونقوم بتحديد الألوان لتكون Latta [o‏ 15595 
داكنا (gs11, gs5)‏ والتصميم يكون 3×3 لكل فصل شتاء ونحدد بأن مربع 
والخيار symxsize(^3)‏ يوفر مساحة في 8 البياني وذلك بوضع الرموز 
في مربع شرح الرسم البياني ليكون عرضها 9630 بدلا من العرض 
الافتراضي. 

.graph twoway area mtdepth bosdepth dayseason 
if dayseason»29 &dayseason<160, 

bcolor(gs11 gs5) ytitle("Snow depth, cm") 
by(season, rows(3) note("") 
legend(position(3))) 

xlabel(30(30)150) ylabel(0(20)80) 


legend(cols(1) label(1 "White Mt") label(2 
"Boston") 


sSymxsize(*.3)) 
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الشكل )32.3( 
الشكل )32:3( be‏ الأجواء اليومية خلال تسعة فصول شتاء بولاية 
نبر إنجلاند» موضحاً كيف أن عمق الثلوج يتغير في مكانين مختلفين وفترات 
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زمنية مختلفة» ففي الفترة من 2001-2000 2 إلى 2004-2003 يبدو أن 
هطول الثلوج كان WES‏ في الجبال مع ب بعض العواصف القوية في مدينة 
بوسطون» ul‏ خلال الفترة 1999-1998 Gils‏ الثلوج أعلى في الجبال مع 
وجود فترات بدون أي وجود للثلوج على الأرض. 

البيانات التي تم تمثيلها في الشكل (32.3) تم جمعها لدراسة كيفية تأثير 
الظروف الجوية بولاية نيوإنجلاند على مستوى الحضور في مناطق التزلج 
(دراسة Lazy (7002, 2003 Hamilton et al.‏ أن مناخ الشتاء بولاية ني وإنجلاند 
أصبح أكثر دفئأ في العقود الأخيرة» فإن انخفاض مستوى الثلوج أصبح هو 
السمة الغالبة» وارتفاع الحرارة يعتبر مشكلة بيئية لها أبعادها التي تؤثر على 
نواح أخرى مثل التزلج خلال فصل cei]‏ مناطق التزلج تتأثر ليس فقط 
بظروف تساقط الثلوج في المناطق المحلية وإنما تتأثر أيضا بمستوى التلوج 
في المدن البعيدة مثل مدينة بوسطون حيث يعيش العديد من المتزلجين. 
الشكل البياني التالي (33.3) يركز على فصل شتاء واحد لسنة 1999 - 
2000 (ملف البيانات «(whitemt2.dta‏ حيث يبدأ بنفس عمق الثلوج في حواف 
الجبال والتي ظهرت في أعلى اليمين بالشكل )32.3( 

الشكل (33.3) يضع بيانات الجليد في حواف الجبال (منطقة الرسم 
البياني (twoway area‏ فوق رسم بياني خطي ings line‏ عدد المتزلجين 
وعدد زيارات المتزلجين في كل يوم في منطقة تزلج واحدة في الجبال 
البيضاء بالقرب من مكان جمع بيانات عمق الثلوج» تم إنشاء رسم بياني 
يوضح عدد الزيارات (visits)‏ وعدد الزيارات المتوقع الذي تم حسابه بنموذج 
سلاسل زمنية (model)‏ النموذج تم شرحه بدراسة Hamilton et al.‏ )2007( 
يتوقع الحضور اليومي كدالة للعوامل الدورية الأسبوعية مع الجو وظروف 
coti‏ في الجبال ومدينة بوسطونء الأمر graph.‏ يقوم بإنشاء الشكل )33.3( 
مخصصاً المحور ر بالجانب الأيسر لتمثيل بيانات عمق الثلوج بالسنتيمتر 
(mtdepth, dosdepth)‏ والمحور بر في الجانب الأيمن لتمثيل عدد الزوارء 
C354 g‏ الخاص ( visits, model) sl‏ 
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الشكل )33.3( 
يجب ملاحظة أن الإعدادات الدقيقة للخيارات yscale(range())‏ و ylabel()‏ 
لكل من الرسمين البيانيين في الشكل (33.3) حيث استطعنا أن نطابق بين 
المقاييس» بحيث إن خطوط الشبكة الأفقية في الرسم تمثل مقاييس متغيرين 
اثنين في نفس الوقت وهذا ليس عملياً لكل أنواع البيانات» ولكن يمكنه تطوير 
الرسم بزيادة وضوحه وإظهاره لمقاييس مختلفة على المحاور العمودية على 


يمين ويسار الرسم البياني. 
.graph twoway area mtdepth bosdepth dayseason,‏ 
yaxis(1)‏ 
ytitle("Snow depth, cm", axis(1)) bcolor(gs12‏ 
gs6)‏ 
ylabel(0(10)60, axis(1))‏ 
line model visits dayseason, yaxis(2)‏ || 
lwidth(medthin medthick)‏ 
ylabel(0(1)3, axis(2)) lcolor(gs1 gs0)‏ 
if dayseason»29 &dayseason«160,‏ || 
r2("Daily skier/snowboarder visits")‏ 
xlabel(30(30)150)‏ 
xtitle("Days since November 1") .-‏ 


legend(rows(4) position(2) order(4 3 1 2) 
label(1 "White Mt") 
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label(2 "Boston") label(3 "model") label(4 
"attend") 

symxsize(*.3)) 

yscale(range(0,51) axis(1)) ylabel(0(10)50, 
axis(1) grid) 

yscale(range(0,5100) axis(2)) 
ylabel(0(1000)5000, axis(2)) 


أعلى قمتين في الرسم البياني في زيارات منطقة التزلج كانتا خلال فترة 
عطلة المدارس والتي تأتي بالتصادف مع هطول الثلوج في مدينة بوسطون. 
الدراسة الأصلية قامت باختبار وتأكيد التأثير المعنوي لهذه «hel gall‏ وسوف 
يكون من الأسهل تمثيل البيانات بعدة أشكال بيانية ودمجها في شكل واحدء 
كما تم في الشكل (32.3) بدلاً من استخدام شكل واحد كما حدث في الشكل 
(33.3). 


أهرامات aae‏ السكان والتي تستخدم بشكل كبير بواسطة علماء الجغرافيا 
السكانية لتمثيل تركيبة Guill‏ والجنس للسكان»ء وهذه الأهرامات ليست ضمن 
أنواع الرسم البياني ببرنامج ستاتاء ولكن يمكن تركيبها بواسطة أعمدة بيانية 
أفقية من خلال استخدام الأمر «graph hbar‏ وهناك العديد من الطرق 
الأخرى للقيام بذلك» الشكل )34.3( يوضح إحدى طرق إنشاء هذا النوع من 
الرسومات البيانية باستخدام هرم لمعدل المواليد بمقاظعة Cape‏ لاند في 
الدينمارك والتي تقطنها أغلبية عرقية من الإسكيمو في سنة 2006 (المرجع: 
Hamilton and Rasmussen‏ 2010( عدد الإناث في كل فئة عمرية تم الإشار 
إليه بواسطة عمود إلى يمين مركز الرسم» وعدد الذكور الذي في نفس الفئة 
العمرية بواسطة عمود إلى اليسارء المجموعات ذات الفئة العمرية 90 سنة 
كانت كبيرة لتوصيفها بشكل ca iis‏ لذا فقد تم تلوينها بلون بشريط رمادي 
لكل 20 سنة (19-0 سنةء 39-20 سنة وهكذا). على سبيل المثال» الرسم 
البياني يُشير إلى أنه في سنة 2006 معدل المواليد يتضمن 600 من الذكور 
أعمارهم 40 سنةء ولكن أقل من 500 من الإناث أعمارهن 40 سنة لنفس 
الفترة» وهذا يعكس اختلاف الجنس في صافي الهجرة الخارجية»ء البروز 
الرئيس في هذا الهرم يُظهر الارتفاع الكبير في معدل البالغين في الففة 
العمرية من 49-35 سنة (الذين ولدوا في الخمسينيات والستينيات) متبوعا 
بمجموعات من الشباب البالغينء كما يمكننا مشاهدة زيادة واضحة في عدد 
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المواليد الذين ولدوا في الثمانينيات والتسعينيات إلى البالغين من الزيادة 
كبيرة من الأطفال. 
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الشكل )34.3( 


هناك العديد من الطرق التي يمكن استخدامها لإنشاء الشكل )34.3( 
فصف البيانات (greenpop.dta)‏ يحتوي على axe‏ من males_ S3‏ والإناث 
females‏ في كل الأعمار cage‏ ولإنشاء رسم بياني يمثل الذكور على اليسارء 
نحن نحتاج إلى إنشاء متغير جديد يساوي عدد الذكور بإشارة سالبة. 

.gen negmales--males 
يمكن إنشاء هرم بسيط بدون أي توصيفات وذلك بطباعة الأمر:‎ 


graph hbar (sum) negmales females if year==2006, 
over(age, descending gap(0) label (nolabel) ) 


ولإظهار نطاقات رمادية في الخلفية بحيث تبرز نطاقات لكل 20 سنةء 
فإننا نحتاج إلى تحديد متغيرات Asad y‏ هي femGRAY s maleGRAY‏ حتسى 
Sus‏ الرسم البياني بموكب أو ناقص 700 كما يلي: 
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.gen  maleGRAY = -(700-males) if (age>=20 
&age<40) 

|(age>=60 & age«80) 

.gen femGRAY = 700-females if (age»-20 &age<40) 
| (age»260 &age«80) 

الشكل )34.3( يمكن رسمه الان» وذلك بوضع المتغير ات negmales,‏ 

females, maleGRAY, femGRAY‏ في أعمدة أفقية مع نصوص لتوصيف 

المناطق الرماديةء كما يمكننا تطبيق توصيفات Sie‏ "600" على 600- على 

المحور العمودي y‏ حتى لا يظهر عدد الذكور سالبا في الرسم. 

.graph hbar (sum) negmales females malGRAY 
femGRAY if 

year==2006, 

over(age, descending gap(0) label (nolabel) ) 

ylabel(-600 "600" -400 "400" -200 "200" 0 200 
400 600) 

ytick(-700(100)700, grid) legend(off) stack 

ytitle("Greenland-born males (left) and females 
(right)") 

bar(1, color(emidblue)) bar(2, color(maroon) ) 
bar (3, 

color(gs14) ) = 

bar(4, color(gs14)) text(550 97 "2006", 
 Size(large)) 

text(-550 11 "Age O to 19") 

text(-550 33 "Age 20 to 39") text(-550 53 "Age 
40 to 59") 


text(-550 76 "Age 60 to 79") text(-550 95 "Age 
80+") 


الشكل )35.3( يدمج خمسة رسومات بيانية مبسسّطة مع نص ليعرض 
شكلاً بيانياً له بعض خصائص الجدول والشرح معا. الشكل الجديد يعسرض 
التغير فى عدد السكان للفترة من 2000-1990 لمختلف المجموعات العرقية 
التي تعيش في المحافظات البعيدة بجنوب الولايات المتحدة (حسب بياناتة 
التعداد السكاني للولايات المتحدة لسنة 2005( الجانب الأيسر للشكل )35.3( 
عبارة عن رسم بياني من نوع twoway‏ وللقيام بعرض تغيرات عدد السكان 
تم تمثيل المتغيرات Lily‏ لكل مجموعة عرقية Gll..popwhho, popwhh‏ وهي 
تمثل مجاميع تم حسابها لكل مجموعة عرقية US‏ يظهر في الشكل البياني 
أدناه (البيانات موجودة بالملف (southmig1.dta‏ معلومة إضافية مهمة لا تظهر 
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في منطقة الرسم البياني نفسه ولكن يمكن ملاحظتها من خطين تم توصيفهما 

لكل مجموعة عرقية في مربع شرح الرسم» فمثلا يستطيع القارئ أن يرى 

من خلال مربع شرح الرسمء أن عدد السكان الذين تمتد أصولهم من أمريكا 

اللاتينية Hispanic‏ قد زاد في الولايات الجنوبية بنسبة %61 خلال هذا العقد 

من حوالي 800,000 نسمة إلى 1.3 مليون نسمة وأصبحت نسبتهم أكثر 
وضوحا مقارنة مع باقي المجموعات العرقية الأخرى. 

-graph twoway area popwbho popwbh popwb popw 

year, 

legend(rows(4) position(3) symxsize(3) 

label(1 "Other, +50%" "0.3 to 0.5m") 

label(2 "Hispanic, +61%" "0.8 to 1.3m") 

label(3 "Black, +7%" "3.6 to 3.8m") 

label(4 "White, +65" "14.9 to 15.7m")) 

xlabel(1990 2000) xtitle("") 

ylabel(0(5)20,angle(horizontal) grid) 

ytitle("Population in millions") 

title("Population growth 1990-2000") 


Population growth 1990-2000 % growth due to migration 


» White 1296 
B 


Black 0% 


8 Hispanic 3496 
B Other 26% 






ü Other, +50% 
0:8 to 0.5m 

a Hispanic, +61% 
0.8 to 1.3m 

8 Black, +7% 
3.6 to 3.6m 

8 White, +696 
14.9 to 0 


Poulation in millions 
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الجانب الأيمن للشكل )35.3( يتكون من أربعة أشكال دائرية تعرض 
النسب المئوية للنمو السكاني نتيجة الهجرة كل دائرة تم رسمها بشكل 
Satie‏ اكةد اد الات dia. cial $3 gs gall‏ مو ريو cs] Wied‏ سكل 
دائري يوضح أن %12 من العرق الأبيض كان نموه نتيجة الهجرة 
المتغيرات التي تظهر في الرسم البياني تمثل صافي الهجرة netmig w)‏ عبارة 
عن المجموع الكلي للهجرة الداخلية ناقص الهجرة الخارجية) ونمو عدد 
السكان نتيجة الزيادة الطبيعية nonmig w)‏ عدد المواليد ناقص عدد الوفيات). 


.graph pie nonmig w netmig w, 

legend(off) pie(1, color(dkorange)) pie(2, 
color(gs13) ) 

title("White 12% ", position(2) ) 


كل رسم بياني دائري يتم حفظه pie white.gph Sis «aul‏ وبعد إنشاء 
وحفظ الأشكل الأربعة الدائرية يمكن دمجها معا باستخدام الأمر 
-graph combine‏ 


-graph combine pie other.gph pie hisp.gph 

pie black.gph pie white.gph, 

imargin(tiny) rows(4) 

title("% growth due to migration") fxsize(40) 


الخيار tfxsize(4)‏ يقوم بدمج الأشكال الدائرية الأربعة في شكل واحد 
ويستخدم %40 فقط من العرض «il shall‏ وبالتالي عند دمجه مع الجانب 
الأيسر للشكل (35.3) فإن الرسم البياني الدائري سوف يأخذ أقل من نصف 
العرض الكلي للشكل. 

هذه الأمثلة توضح بعض الإمكانات لتصميم الرسومات البيانية ببرنامج 
ستاتا بدمج العناصر مع بعضها بطريقة أكثر وضوحا. 


^, 


النسل ((( ير 
بيانات الدراسات الاستقصائية 


Survey Data 





هذا الفصل يعتبر مقدمة مختصرة للعمل مع بيانات الدراسات 
الاستقصاتية باستخدام برنامج ستاتاء el all‏ غير المهتمين بالدراسات 
الاستقصائية» يمكنهم الانتقال إلى الفصول الأخرى؛ فلن تؤثر عليهم عدم 
قراءتهم لهذا الفصل. ومن ناحية «gyal‏ المهتمون بالعلوم الاجتماعية والتي 
يعتبر فيها استخدام البيانات الاستقصائية أمرًا في غاية الأهميةء قد يكون من 
المفيد لهم إلقاء نظرة سريعة عن كيفية التعامل مع مثل bull oda‏ ات Lod‏ 
الطرق المتقدمة في تحليل البيانات»ء فسوف تأتي لاحقا في الفصول القادمة. 

بحوث الدرايبات الاستقصائية تركز بشكل كبير على رسم استدلالات 
هة كول اكان 4 Rs‏ العينة العشوائية البسيطة هي أفضل وسيلة 
لمتل هذا النوع من الدراسات» ولكن في العادة» فإن هذه الوسيلة مكلفة daa‏ 
وبدلاً من استخدام العينة ret:‏ البسيطة يمكن اس تخدام طرق أخرى 
cei‏ ولكنها ACER‏ تستخدم استراتيجيات معينة معقدة لتحقيق أهداف معينة» 
وللحصول على تمثيل معقول لمجتمع الدراسة. كما أنها قد تتطلب إجراء 
بعض التعديلات بعد إجراء عملية المعاينة. وحيث إن الطرق الإحصائية 
المعيارية تقوم على فرضية أن العينة عشوائية بسيطة لذلك فنحن نحتاج إلى 
طرق متخصصة لتصميم بيانات الدراسات الاستقصائية التي يمكن أن تأخذ 
في الاعتبار الحصول على معلومات عن إجراءات المعاينة. 

برنامج ستاتا من البرامج القوية في تحليل بيانات الدراسات 
الاستقصائية» معتمداً على مدخل موحد يشمل مجموعة كبيرة من طرق 
التحليل الإحصائيء كل هذه الطرق تعمل من خلال تعريف أساسي لتركيبة 


186 الإحصاء مع برنامج ستاتا 





العينة والتي يمكن أن تتضمن أوزانا احتمالية لتقليل التحيز عند اختيار العينة. 
وتصميم العينة يمكن أن يتضمن أيضا تعقيدات أخرى مثل تحديد الطبقات 
العنقودية متعددة al pall‏ والمجتمعات المحددة» في مستوى واحد أو أكثرء 
والمعاينة الإرجاعيةء والأوزان التكراريةء ومابعد تحديد الطبقات؛ وعند 
تحديد عناصر التصميم الرئيسة في الدراسة الإستقصائية (باستخدام الأمر 
«(svyset‏ سوف يتم حفظ مجموعة من البيانات باستخدام المعلومات المعطاة 
وبعد ذلك يتم التحليل باستخدام الأمر svy‏ الذي سيقوم بتطبيق الأوزان 
ومعلومات التصميم الأخرى تلقائيا كما هو مطلوب. 

أغلب إجراءات الدراسات الاستقصائية يمكن إجراؤها باستخدام القوائم 
والعديد من القوائم الفرعية وذلك باختيار Statistics > Survey data‏ 
15 . وللحصول على معلومات أكثر حول أوامر الدراسات 
الاستقصائية» قم بطباعة الأمر help survey‏ كما أن دليل المستخدم Survey‏ 
Data Reference Manual‏ يشر c‏ العديد من الأمثلة والتفاصيل التقنية لجميع 
أوامر ستاتا المتعلقة بالدراسات الاستقصائية. المراجع الأخرى المفيدة 
تتضمن Liss‏ عن المعاينة للكاتبين Levy and Lemeshow‏ )1999( وكتاب عن 
تحليل بيانات الدراسات الاستقصائية مع أمثلة' عن الإحصائيات الحيوية 
للكاتبين Korn and Graubard‏ )1999(« كما أن Sul and Forthofer‏ )2006( يقدمان 
نظرة مختصرة عن المسائل الرئيسة في تحليل بيانات الدراسات 
الاستقصائية. وللاطلاع عن نقاش abe‏ عن مشاكل الأسئلة المفتوحة 
بالدراسات الاستقصائية انظر Moore US‏ )2008(- 
أمثلة عن الأوامر : Example Commands‏ 

|:Svyset n [pweight = censuswt] 

يقوم بتحديد البيانات على أنها بيانات دراسة استقصائية مع أوزان احتمالية 

(نسبي إلى الاحتمال العكسي للاختيار) ثم إعطاؤها بواسطة المتغير scensuswi‏ 


المحدد م_ الذي يحدد المشاهدات الفردية (افتراضي) كوحدات معاينة رئيسة. 
-Svyset n [pweight = censuswt], strata(district)‏ 
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يُحدد gl‏ البيانات هي بيانات دراسة استقصائية مأخوذة من عينة طبقية 
ذات مرحلة baal y‏ حيث تم تقسيم المجتمع إلى طبقات وأفرادء وتم أخذ Auc‏ 
مستقلة من كل طبقة» وفي هذا المثال فإن المتغير district‏ يحدد الطبقات» 

والمتغير censuswt‏ يحدد الأوزان الاحتمالية. 
.svyset school [pweight - finalwt], fpc(nschools)‏ 
_n, f£pc(nstudents)‏ || 


يحدد أن البيانات هي بيانات دراسة استقصائية من Aue‏ عنقودية ذات 
مرظن في المرلة الأزلى ت لحقان danane mko‏ 
المدارس هي وحدة المعاينة الأولية. Lol‏ في المرحلة A all‏ فتم خلالها 
اختيار الطلبة بطريقة عشوائية من المدارس التي تم اختيارها في المرحلة 
الأولى» وفي كل مرحلة تم تحديد تصحيحات المجتمع المحدد «FPSs)‏ 
فالمتغير nschools‏ يمثل مجموع aac‏ المدارس في المجتمع. والمتغير 
5 يمثل مجموع عدد الطلبة في كل مدرسة. 
.Svy: tabulate vote, percent miss ci‏ 
الحصول على جدول بالنسب المرجحة وحدود الثقة للمتغير vote‏ يتضمن 
القيم المفقودة بناء على بيانات دراسة استقصائية -svyset‏ 
.Svy: tabulate vote gender,column pearson lr wald‏ 
الحصول على جدول تقاطعي لأو زان المتغير vote‏ مع المتغير gender‏ 
مع نسبة كل عمود للمتغير gender‏ كما أن الجدول سوف يعرض نتائج 
اختبار مربع كاي تربيع لبيرسو»ء ومعدل الأرجحية كاي تربيع وإحصائيات 
اختبار وولد -Wald test‏ 
-Svy: regress y x1 x2 x3‏ 
يعرض انحدار المتغير ر بالدراسة الاستقصائية مع ثلاثة متغيرات تنبؤية 
وهي x3, 32, x]‏ وللحصول على قائمة كاملة لأنواع أوامر الانحدار وطرق 
الثقدير في الدراسات الاستقصائية قم بطباعة الأمر -help svy estimation‏ 


-Svy, subpop(voted): regress y x1 x2 x3 
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يقوم بتحليل الانحدار للدراسة الاستقصائية باستخدام مجتمع ثانوي تم 
تعريفه بواسطة 1 و القيم )0,1( للمتغير «voted‏ اختيار مجموعة تانوية من 
البيانات ex‏ بطريقة اعتيادية من خلال استخدام محددات مثل N MY in b if‏ 
يعتبر Lgs‏ عند تحليل الدراسات الاستقصائيةء ولكن بدلا من ذلك يتم 
استخدام الخيارات -subpopO 5 svy‏ 

.Svy: mean age, over(gender) 

يقوم هذا الأمر بحساب المتوسط المرجح» وفترات الثقة للمتغير م 

لفئات المتغير gender‏ 


Declare Survey Data : الدراسة الاستقصائية‎ obu uas 


منذ سئة 2001 قام مركز ولاية cad‏ لاستطلاعات الرأي بجامعة 
نيوهامبشيرء بإجراء دراسات استقصائية عبر الهاتف عدة مرات في كل سنةء 
وكل دراسة قامت بالاتصال بعينة جديدة تتكون من 50 شخصا وسؤالهم عن 
آرائهم وعن خلفياتهم. نتائج استطلاعات الرأي السياسية تجذب اهتمام الرأي 
العام كل أربع سنوات خاصة خلال فترة الحملات الانتخابية الرئاسيّة بولاية 
هامبشير» الملف Granite2011 6.dta‏ $2 ي على أسئلة لدراسة استطلاعية 

2011 جرانيت لعدد 516 شخصا في يونيو‎ S ja قام بها‎ 
.use C: NdataNGranite2011 6.dta, clear 


M 


-describe, short 


Contains data from C:\data\Granite2011_6.dta 


obs: 516 New Hampshire, Granite State 
Poll -- June 2011 

vars: 33 2 Jul 2012 06:11 

size: 19,608 


Sorted by: respnum_ 
كما يحدث في أي دراسة استقصائية فإن تصميم المعاينة» ونمط الردود‎ 
يؤديان إلى الحصول على بيانات تختلف عن المجتمع المستهدف. فمد‎ Lay 
بيانات التعداد السكاني توضح بأن أقل من %52 من البالغين في الولاية هم‎ 
من الإناث؛ ولكن_النساء يمثلن نحو %55 من نسبة العينة.‎ 


.tab sex 
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Gender Freq. Percent Cum. 








Male 
Female 





لتعويض التحيز البسيط في العينة» تقوم بحوث الدراسات الاستقصائية 
بحساب الأوزان الاحتمالية. فبعض هذه الأوزان يتم حسابها من خلال 
المقارنة بين خصائص العينة والمجتمع مثل الجنس في العينة أعلاه 
والحسابات الأخرى يتم القيام بها sli‏ على خصائص تصميم العينة» بالنسبة 
للباحثين بمركز جرانيت فإنهم يقومون بتعريف المتغير censuswt‏ على أنه 
عبارة عن تجميع لحجم أرباب الأسرء وأرقام الهواتف» والجنس» والديانة 
بالولاية. وقيم المتغير consuswt‏ في استطلاع الرأي لشهر يونيو 2011 كان 
متوسطه 1» ولكن المتوسط يتغير من 0.16 (هناك بعض المشاهدات تم 
إعطاؤها أوزاناً مرجخة منخفضة لتعويض التمثيل المرتفع في العينة) إلى 
9 (تم إعطاء أوزان مرجحة مرتفعة لتعويض التمثيل المنخفض في 


العينة). 
.summarize censuswt‏ 
Variable Obs Mean Std. Dev. Min Max‏ 
censuswt 516 .9991743 .4601123 .1603937 2.194549‏ 


الأمر isvyset‏ يحدد أن البيانات الموجودة هي بيانات دراسة استقصائيةء 
مع إعطاء ola‏ احتمالية بواسطة المتغير Las  ccensuswt‏ هذه البيانات» e‏ 
Jada‏ هذه المعلومات تر Lage‏ تالرغم :من إمكانية placed‏ الأوزان: في أي 
تحليل إحصائي عند الحاجة إلى ذلك في تحليل معين» ما عدا ذلك فإن هذه 
البيانات لن تتغير. 

-Svyset n [pweight = censuswt] 

pweight: censuswt 

VCE: linearized 

Single unit: missing 


Strata 1: «one» 


SI 1: «opservations» 
EPGC.T 


fl «Zero» 
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.Save, replace 


.8vydescribe 
Survey: Describing stage 1 sampling units 


pweight: censuswt 
VCE: linearized 
Single unit: missing 
Strata 1: «one» 
SU 1: «observations» 
FPC 1: «zero» 


#Obs per Unit 





Stratum #Units #Obs min mean max 
1 516 516 1 1.0 1 
1 516 516 1 1.0 1 


عند تحديد بيانات الدراسة الاستقصائية باستخدام الأمر isvyset‏ فإن 
الأوامر التي تبدأ ب svy‏ سوف تقوم بإجراء الحسابات الإحصائية مستخدمة 
معلومات وزن الدراسة الاستقصائية» وبعد ترجيح تمثيل الجنس بالعينة ليكون 
أقرب للقيمة المتوقعة في المجتمع. 

.Svy: tab sex 


(running tabulate on estimation sample) 














Number of strata = 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 
^ 
Gender proportions 
Male 
Female .5035 
Total 
Key: proportions = cell Proportions 


العديد من أوامر ستاتا من الجداول البسيطة إلى النماذج الإحصائية؛ 
تسمح بإضافة : svy‏ قبل الأمر. فمثلا يمكننا حساب الانحدار المنطقي 
المرجح (في الفصل 9) لوجهات النظر الفردية حول التغير المناخي T‏ 
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المتعلقة بالمتغير warmop2‏ — مع مستوى تعليم المشارك في الدراسة وحزبه 
cull‏ من خلال الام i ul‏ 
.Svy: logit warmop2 educ party‏ 

للحصول على قائمة بالاحتمالات التحليليةء قم بطباعة الأمر «help survey‏ 
الأمر svyset‏ يمكنه أن يحدد معلومات أكثر على أنها معلومات دراسة 
استقصائية بطرق أخرى مختلفة عن تلك التي سبق أن رأيناها في الأمثلة 
السابقة» فخيارات الأمر svyset‏ تسمح ul‏ بإنشاء تصميمات PE‏ تتضمن 
معاينة عنقودية متعددة «Jal pall‏ وطبقية وتصحيح المجتمع المحدد وطرق 
بديلة لتقدير التباين وإضافة طبقات جديدة. وللحصول على قائمة كاملة 
بالخيارات المتوافرة وتركيباتهاء قم بطباعة الأمر „help svyset‏ كما أن دليل 
المستخدم Survey Data Reference Manual‏ يشر € أمثلة وتقنيات عن هذا 
الموضوع بشكل أكثر تفصيلاً. 
تصميم الأوزان : Design Weights‏ 

Qo Aga y bees GNI Cilia ei ule ركز‎ goal e jell 
مستخدمي البيانات يبدأون عملهم ببيانات استقصائية كاملة تم حساب أوزانها‎ 
مسبقاً. هذا الجزء والأجزاء القادمة» سوف تعرض أمثلة توضح كيفية حساب‎ 
الأوزان.‎ 

الباحثون الذين يستخدمون بيانات الدراسات الاستقصائية يطبقون 
الأوزان الاحتمالية لضبط التحيز في طرق المعاينةء فقد يظهر التحيز نتيجة 
عاملين اثنين هما خصائص مُتعمّدة في تصميم المعاينة أو خصائص مضافة 
بشكل غير مقصود أثناء عملية جمع البيانات» وكلا العاملين يؤديان إلى 
الحصول على Anc‏ غير ممئلة للمجتمع» ولاتعطي صورة واقعية عن تقلبات 
العينة وخصائص المجتمع. 

بالنسبة لمركز جرانيت لاستطلاع الرأيء فإن الباحثين يقومون بالاتصال 
بعينة عشوائية من سكان نيوهامبشير عن طريق الهماتف» ونظريا أرقام 
الهاتف العشوائية يمكن أن تنتج Ake‏ عشوائية من سكان AN sll‏ فعند إجراء 
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استطلاعات عن الانتخابات أو أي موضوع آخرء فإن الباحث يريد تعميم 
نتائجه ليس فقط على السكان الذين تم الاتصال بهم ولكن على كل الناخبين 
الذين يعيشون في الولاية. فبعض السكان هم من البالغين فقطء وبعضهم 
الآخر مختلط. بين المجيبين عن الاتصالات الهاتفية لاستطلاع يونيو 2011 
هناك نحو %29 قالوا إنهم يعيشون في بيت به شخص بالغ واحد فقط. 
الإجابات في هذا المثال محددة: 'واحدء اثنين؛ ثلاثة أو أكثر". وهذا شيء 
عملي للمقارنة بين الأوزان الترجيحيةء هناك 503 أشخاص فقط من J‏ 
6 قاموا بالإجابة عن سؤال عدد البالغين في البيت» سوف نعود لاحقاً 
للذين لم يجيبوا عن هذا السؤال وعددهم 13 شخصاً. 

.tab adults 


# adults in 
household Freq. Percent Cum. 





بالرغم من أن %29 من أفراد العينة يعيشون في بيت به شخص بالغ 
واحد» فإنه من الخطأ توقع نفس النسبة لكل سكان ولاية هامبشير. ولاختيار 
شخص واحد بطريقة عشوائية عند إجراء الاتصالات الهاتفيةء الباحث الذي 
قام بالاتصال سوف يسأل عن شخض بالغ في البيت للحديث معه» أو سوف 
يقوم بالاتصال في وقت آخر عند عدم الرد على الهاتفء هذا يؤدي إلى أن 
البيوت التي يعيش فيها شخص بالغ واحد أقل احتمالا بثلاث مرات أن يدخلوا 
فن ca gall i fia Sigal‏ ال ريش فا ف ان أن لعفن dial‏ 
أعلاه» يوضح بأنه يجب عد المكالمات الهاتفية لكل البيوت التي يجب أن 
تكون على الأقل 9407(82x3)*(273x2)*(148x1)‏ شخصا بالغا. في 
هذه العينة الوهمية Quill‏ يعيشون في بيت به شخص بالغ واحد يمتكتون 
9407148 أو نسبة %16 وهي أقل بكثير من نسبة 9629 بالجدول أعلاه. 
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Å all الاستقصائية تعتبر طريقة لتصحيح التحيز في‎ Ala jal N51 
أكثر واقعية. في هذا المثال الأوزان‎ eis كما أنها تساعد في الحصول على‎ 
Gal لاغز‎ Aga السكان في الولابة وإنما أيضا‎ axe مهمة ليس فقط لشرح‎ 
ue ار و د او‎ S أخرى مثل‎ 
السن الذين يعيشون‎ GUS بالغ واحد في المنزلء ربما يرتبط بنسبة كبيرة من‎ 
وحدهم؛ ووجود شخصين بالغين في المنزل يعني وجود العديد من الأسر‎ 
CE purr ce أشخاص بالغين دلالة على أن‎ tac الشابة» ووجود‎ 
بالغين شباب مع أصدقائهم يعيشون في المنزل.‎ 
الأوزان الاحتمالية تتناسب مع معكوس احتمال الاختيار. ففي المثال‎ . 
أعلاه الاحتمال الشرطي لاختيار شخص معين من منزل به شخص بالغ‎ 
واحد (بافتراض أننا قمنا بالاتصال بذلك المنزل) يساوي واحدء واحتمال‎ 
اختيار شخص معين من منزل به شخصان بالغان يساوي 2/1 ومن منزل‎ 
به ثلاثة أشخاص بالغين 3/1. وإذا قمنا باستخدام معكوس هذه الاحتمالات‎ 
ولكن هذا‎ Lary Lads 0 كأوزان» فإن العينة سوف تتضمن‎ 3 221 
من الالتباس» وللحفاظ‎ le gi سوف يقود إلى مجاميع غير صحيحة؛ ويسبب‎ 
على حجم العينة الصحيح يمكننا ضرب معكوس الاحتمالات في نسبة‎ 
الأشخاص الحقيقيين إلى الوهميين 940/503 فإن هذه الخطوة سوف تقوم‎ 
وهو يحتوي على الأوزان الاحتمالية‎ s adultwt بإنشاء متغير جديد باسم‎ 
لتصحيح تحيز العينة المعروف» مع الحفاظ على حجم العينة الأصلي.‎ 
منزل)؛ 1.070 (شخصان‎ JS الأوزان تساوي 0.535 (شخص بالغ واحد‎ 
(ثلاثة أشخاص أو أكثر بالغين بكل منزل)» القيم‎ 1.605 «Uo: JS بالغان‎ 
3:2:1 المفقودة سوف تأخذ الوزن المحايد وهو 1ء ونسبة هذه الأوزان تظل‎ 
.generate adultwt - adults*(503/940) 


replace adultwt = 1 if missing(adultwt) 
.tab adults, summ(adultwt) miss 





* adults in 
household 












Summary of adultwt 
Mean Std. Dev. 
.53510636 
1.0702127 
1.6053191 
1 


ooo © 
œ 
N 





. 99999997 .35080553 516 
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aM‏ عه وم مع ium uoo‏ 

إذا كان هذا التعديل مرغوبا 448« فيمكننا استخدام الأمر svyset‏ مع بيانات 
المتغير adultwt‏ كأو زان احتمالية. 


.svyset n [pw = adultwt] 


pweight: adultwt 
VCE: linearized 
Single unit: missing 
Strata 1: «one» 
SU 1: «observations» 
FPC 1: «zero» 


.8vy: tab adults, percent 


(running tabulate on estimation sample) 







Number of strata z 1 Number of obs = 503 
Number of PSUs = 503 Population size = 502.99998 
Design df = 502 
# adults 
in 
household | percentages 
Key: percentages = cell percentages 


النسب الموزونة (مثل %16 من شخص واحد بالمنزل Ya‏ من 9629 
كما في البيانات الخام) يعطي صورة أكثر واقعية. 
الاوزان اطرجحة الطبقية اللاحقة : Poststratification Weights‏ 

الجزء السابق في هذا الفصلء قدم مثالا على الأوزان المرجحة بناءً 
على تصميم المعاينة والتي كانت معروفة قبل تصميم عملية جمع البيانات. 
النوع الثاني من الأوزان المرجحة يمكن تعريفه بعد جمع البيانات. فبالرغم 
من توخي الدقة عند جمع البيانات» فإنه من الممكن أن البيانات لا fd‏ بعض 
خصائص المجتمعء كَمَثلاً قد يكون هناك اختلاف واضح بين توزيع العمر أو 
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الجنس في العينة عند توزيع المجتمع المستهدف. مما يجعل النتائج عرضة 
للتساؤل» فالتوزيع الطبقي اللاحقء يشير إلى الأوزان الاحتمالية المحسوبة 
حتى تكون نسب مجموعات معينة أو طبقات.في العينة قريبة بدرجة معقولة 
لما هو موجود في المجتمع. 

ففي عينة مركز جرانيت لاستطلاع الرأي» كانت نسبة الإناث 
0654.65( ولكن حسب تعداد السكان لسنة 2010 نسبة SLY)‏ البالغات 
بولاية هامبشير %51.6 فقطء وإذا أظهرت نتائج الدراسة الاستقصائية بأن 
نسبة GUY!‏ بالمجتمع %54.65 فهذا يكون جنوحا كبيرا! عن الواقع. 
بالإضافة إلى ذلك؛ فقد نحصل على نتائج خاطئة حول العناصر الأخرى 
المرتبطة بالجنس مثل الانتخاب. هذا التحيز الواضح في عدد الردود يمكن 
أن يؤثر على قدرتنا في الحصول على استدلالات صحيحة في مجتمعات 
أكبر. 


.tab sex 







Gender Percent 









Male 
Female 





هناك العديد من الطرق للوصول إلى التقسيم الطبقي اللاحق (الطريقة 
البديلة للأسلوب اليدوي الموضح أدناه هو استخدام الأمر svyset‏ والذي يوفر 
خيار poststrata‏ الذي تم شرحه بالتفصيل Qua‏ المستخدم Survey Reference‏ 
(Manual‏ إذا كنا نعرف نسب المجتمع الصحيحة للمتغيرات الرئيسة - كما 
gages go abd‏ الجن بالمكال el‏ فسان cassa E‏ تير 
الإجابات يمكنه حسابها من خلال قسمة نسب. المجتمع على نسب العينةء 
فمثلاً متغير الجنس ser‏ تم ترميزه بحيث يساوي 0 للذكورء وهم يمثلون 
4 من البالغين في المجتمع بولاية هامبشيرء ولكن نسبتهم في العينة 
هي 5 فقط وليس هناك أي قيم مفقودة لمتغير الجنس ser‏ في بيانات 
العينة. 


- 
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يمكننا حساب الأوزان حيث uel G3‏ من 1 بقليل 48.4 + 45.35 = 
7 للذكورء SLD Ul‏ فهي أقل من 1 يقليل 0.944=54.65+51.6 
.generate sexwt = 48.4/45.35 if sex==0‏ 


.replace sexwt = 51.6/54.65 if sex==1 
.tab sex, summ(sexwt) 


Summary of sexwt 
Std. Dev. 





Mean 














1.0672547 
.94419032 


Male 
Female 








99999857. 
إذا استخدمنا الأمر svyset‏ مع بيانات المتغير ser‏ كوزن احتمالي» فإن 
الخيار svy:tab‏ يقوم بإنتاج جدول مرجح يعرض النسب الحقيقية للذكور وهي 
4 وللإناث 9651.6 بعد حساب الأوزان الطبقية اللاحقة من الأفضل 
فحص ما إذا كانت الأوامر قد قامت بوظيفتها كما ينبغي أم لا؟ 


.06132481 





.Svyset [pw = sexwt] 


pweight: sexwt 
VCE: linearized 
Single unit: missing 
Strata 1: «one» 
SU 1: «observations» 
FPC 1: «zero» 


.Svy: tab sex, percent ` 


(running tabulate on estimation sample) 


Number of strata = 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.99926 
Design df = 515 


Gender percentages 





Key: percentages - cell percentages 
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من الممكن حساب أوزان طبقية لاحقة أخرى باتباع طريقة مشابهة, 
فمثلا إذا افترضنا أنه في دراسة أخرى نريد تقدير توزيع العمر والعرق 
والجنس في المجتمع»ء فيمكن أن يتم ذلك باتباع الخطوات التالية: 

1 - إنشاء جدول لنسب العمر والعرق والجنس من تعداد سكاني أو بيانات 
أخرى مثل ase‏ البالغين القاطنين بالمنزل عن المجتمع المستهدف. فإذا 

lid‏ باستخدام خمس مجموعات للعمر )29-18. 39-30.. الخ) 

ومجموعتين للعرق (أبيض» غير أبيض) فإن النتائج سوف تكون في 20 

رقم Sie (2x5)‏ نسبة البالغين البيض الذكور في المجتمع في مجموعة 

29-18 سنة» أو نسبة SLY!‏ البيض في مجموعة 29-18 سنة وهكذا. 
72 الحصول على جدول مشابه للجدول السابق يوضح نسب العمر والعرق 

الجن من المثال» فمفلا غند إنشاء متغير ute‏ باهم ARS‏ يجمع بين 

العمر والعرق والجنس وإنشاء جدول له: 


.egen ARS = group(agegroup race sex), 
lname(ars) 


.tab ARS 
فعلى‎ .generate ... if تعريف مجموعة أوزان جديدة باستخدام الأمر‎ -3 
من عدد السكان البالغين في‎ %8.6 Ob سبيل المثال» بافتراض أننا نعلم‎ 
dia 29-18 منطقة هذه الدراسة هم من الذكور البيض في مجموعة‎ 
وأن نسبة %8.2 هم من الإناث البيض في نفس المجموعة» ولكن في‎ 
العينة غير الموزونة نرى أن نسبة 962.6 من الذكور البيض في‎ 
البيض %5.1 مما يعني أن‎ GUY! مجموعة 29-18 سنة وأن نسبة‎ 
البالغين» وهذا لا يمتل النسب‎ aam الذكور يشكلون النسبة الأكبر في‎ 
الحقيقية بالمجتمع» يمكننا إنشاء متغير موزون جديد للعمر والعرق‎ 
يساوي 1 (وهو الؤزن المحايد)ء وإذا كنا لا‎ ARSwr والجنس يسمى‎ 
وغير ذلكء فإنه‎ ud yall نعرف عمر وعرق وجنس المشارك في‎ . 
يساوي نسبة المجتمع. وقسمة نسبة العينة بالنسبة لمجموعة العمر‎ 
والعرق والجنس كما يلي:‎ 


.generate ARSwt = 1 if ARS»- . 
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.label variable ARSwt "Age-race-sex weights" 
.replace ARSwt = 8.6/2.6 if ARS == 1 
.replace ARSwt = 8.2/5.1 if ARS == 2 


تصحيح التقسيم الطبقي اللاحق طريقة مفيدة عند العمل مع دراسات 
استقصائية مصممة تصميما جيداء ويجب ألا يُفهم هذا على أنه علاج 
للأخطاء التي تحدث في المعاينة بالصدفة. مثل هذه التصحيحات يمكن 
تطبيقها بشكل كبير على دراسات استطلاع رأي الناخبين»ء والدراسات 
الاستقصائية بالعلوم الاجتماعية التي تتطلب مجهودا كبيرا للحصول على 
عينة ممثلة للمجتمع. وهناك بعض الدراسات التي تبحث عن دليل مستقل مثل 
نتائج الانتخاب أو التي يتم القيام بها من جديد من قبل باحثين آخرين؛ فهذه 
تعتبر اختبارات حقيقية عن مدى نجاح التصحيحات. 

بيانات دراسة واحدة قد تتضمن وزن متغيرات تم حسابها من أكثر من 
مصدرء مثل تصميم الأوزان» والأوزان الطبقية اللاحقة؛ ولدمج هذه 
المتغيرات في متغير مرجح عام واحد نقوم بضرب ثم نقوم بعمل تصحيح 
حتى يكون المجموع النهائي للأوزان يساوي حجم العينة. فعند وضع الأمر 
Jå quietly‏ الأمر Lili ‘summarize‏ نطلب من ستاتا حساب الإحصائيات 
المختصرة:؛ ولكن لا تعرض النتائج si‏ | للوقت. واستخدام الأمر quietly‏ 
مع الأوامر الأخرىء فإنه سوف يقوم بنفس المهمة. 
-generate finalwt = adultwt*ARSwt‏ 
-replace finalwt = 1 if finalwt>=‏ 


-Quietly summarize finalwt 
.replace finalwt - finalwt*(r(N) /r(sum)) 


يمكن وجود أي عدد من المتغيرات المرجحة في نفس مجموعة البيانات؛ 
واستخدام الأمر svyset‏ باستمرار لاختيار أي متغيرات «dx Jules el jay‏ 
الأوزان تتأثر في التحليل عند تطبيقها فقط باستخدام الأمر syy‏ أو تحديد 


أوامر ترجيح أخرى. خلال بقية هذا الفصل» سوف نرجع إلى بيانات 
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استطلاع الرأي لمركز جرانيت» ونقوم بترجيحها بواسطة المتغير censuswt‏ 
وهو متغير تم حسابه بواسطة مركز الاستطلاع بجامعة نيوهامبشير 
بالولايات المتحدة لتوحيد تصميم الأوزان aas!)‏ البالغين» وعدد خطوط 
الهاتف)» مع تصنيف طبقي لاحق (للجنس والمنطقة بولاية هامبشير). 
.Svyset n [pw = censuswt]‏ 


pweight: censuswt 
VCE: linearized 
Single unit: missing 
Strata 1: «one» 
SU 1: «observations» 
FPC 1: «zero» 


الرسومات البيانية والجداول اطورونة للدراسات الاستقصائية : 
Survey-Weighted Tables and Graphs .‏ 

استطلاع يونيو 1 لمركز جرانيت» يتضمن ستة أسئلة تتعلق 
بالاحتباس الحراري» أو التغير المناخي. مجموعة من هذه الأسئلة كانت 
حقيقية» ولكن واحدا منها (warmop)‏ كان عما هو اعتقادك الشخصي؟ 

أي من العبارات الثلاث التالية تعتقد أنها صحيحة؟ 

- التغير المناخي يحدث الآن وسببه الرئيسي الأنشطة البشرية. 

- التغير المناخي يحدث الآن ولكن سببه الرئيسي القوى الطبيعية. 

- التغير المناخي لا يحدث الآن. 

الباحث قام بتغيير ترتيب خيارات الإجابات لتفادي احتمالية التحيّز. نحو 
5 وافقوا بأن التغير المناخي يحدث الآن وسببه الرئيس الأنشطة البشريةء 
وآخرون يعتقدون بأن التغيرات كانت لأسباب طبيعية )%35( قليلون 
يعتقدون بأن التغير المناخي لا يحدث الآن )263( 


.Svy: tab warmop, percent ci 
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(running tabulate on estimation sample) 


Number of strata z 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 










Personal 
belief 
about 
climate 
change 







percentages 









DK/NA 
Not now 3.05 1.904 4.853 
Now/natu 34.62 30.2 39.32 
Now/huma 54.89 50.11 59.58 






Total 


= cell percentages 
lb 7 lower 95$ confidence bounds for cell percentages 


Key: percentages 


ub upper 95$ confidence bounds for cell percentages 


الأمر ووو : يطيق quic) SAI‏ على dus‏ تم تكذينةها ابق 
بو اسطة الأمر «svyset.‏ والخيار ei‏ يحدد فترات الثقة للنسبة الموزونة 
ويعرضها كحدود سفلى asl) Ule‏ الأدنى Ib‏ والحد الأعلى «(ub‏ وبناء على 
هذه العينة فإننا على درجة ثقة 9695 4X5‏ ما بين %50.11 و 7659.58 من 
البالغين بولاية هامبشير يعتقدون بأن الأنشطة البشرية تقوم بتغيير المناخ. 
أنواع الرسومات البيانية الأصلية ببرنامج ستاتا ليست مناسبة لعسرض 
توزيعات المتغيرات الطبقية مثل النعروضة بالجدول أعلاهء لحسن الحظ 
هناك برنامج يمكن للمستخدم كتابته اسمه catplot‏ ثم شرحها في مجلة 
Stata Journal Goss‏ للكائب كوكس (Cox 2004b)‏ — يقوم بهذه الوظيفة بطريقة 
جيدة» ويمكنك الحصول على الملفات التنفيذية do-files‏ لهذا البرنامج من 
الإنترنت وذلك بطباعة الأمر 
-findit catplot‏ 
وتابع الروابط لتحميل وتثبيت هذه البرامج على جهاز الكمبيوتر لديك 
(الأمر findit‏ يعمل مع مئات, من البرامج المكتوبة بواسطة المستخدمين) وعند 
إنهاء التثبيت قم بطباعة الأمر help catplot‏ لعرض تركيبة الأمر وخياراتة؛ 
الشكل (1.4) يحتوي على رسم بياني عمودي للمتغير -warmop‏ وبالرغم من 
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أن الأمر Y catplot‏ يقبل وضع الأعمدة البيانية في وضع عمودى ويقبل 
الأعمدة الأفقية فقطء فإن إضافة الخيار [aweights = censuswt]‏ في هذا الأمر 
يجعل له نفس ul‏ المرئي لكي تكون الأعمدة.في وضع عمودي ولیس Lash‏ 
موضحة النسب المئوية .svy: tab‏ 


.catplot bar warmop [aweight - censuswt], percent 


Q 
e 


percent 





DK/NA Not now Now/natural Now/human 


الشكل )1.4( 


الرسم البياني العمودي مع توصيفات القيم في العادة أسهل t$ JU‏ من 
الوضع الأفقي بتنسيق (hbar)‏ وخصوصا عندما يكون لدينا العديد من 
الأعمدة. الشكل )2.4( يعرض تنسيقاً أفقياً يتضمن عنواناً وتوصيفات 
للمحاور بشكل مناسب للنشر في التقارير أو لعرض نتائج الدراسة 
الاستقه ماتية» يمكننا توصيف الأعمدة حتى يمكن قراءة النسب المرجحة 
مباشرة من الرسم البياني؛ وهناك نفس العدد تم إيجاده بواسطة الأمر أعلاه 
-Svy: tab‏ 


.catplot hbar warmop [aweight= censuswt], percent 


blabel(bar, format (%3.0£) ) ytitle("Weighted 
percent") 


title("Personal belief about climate change") 
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الإجصاء مع برنامج ستاتا 


Personal belief about climate change 


DK/NA 7 


Not now 3 


Now/natural 35 


Now/human 


Personal belief about climate change 


0 20 40 
Weighted percent 


الشكل )2.4( 


60 


كيف يمكن للتغير المناخي أن يكون متعلقا بالمتغيرات c‏ في 
الدر اسة الاستقصائية» مثل مستوى تعليم المشارك بالدراسة f(educ)‏ يمكننا 
إجابة مثل هذه الأسئلة من خلال الجداول الثنائية. 


.8vy: tab warmopeduc, col percent 


(running tabulate on estimation sample) 


Number of strata = 1 Number of obs 
Number of PSUs = 511 Population size 
Design df 










Personal 
belief 
about 


Climate Highest degree completed 


change HS or le Tech/som College Postgrad Total 















DK/NA 
Not now 5.154 2.694 2.694 1.991 3.083 
Now/natu 33.55 42.81 37.29 24.79 34.71 
Now/huma $1.35 42.23 55.41 69.18 54.68 


Total 


Key: column percentages 


Pearson: 
Uncorrected chi2(9) = 25.1986 
Design-based F(8.81, 4495.16)- 2.4226 P = 0.0102 


7 £6 


511 
510.02315 
510 
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في المثال أعلاهء قمنا بإنشاء عمود للنسب المئويةء GY‏ عمود المتغير 
(educ)‏ يشكل متغير! مستقلا في هذا التحليل» التحليل يوضح أن نحو %69 
هم من حملة شهادة دراسات «Postgrad lle‏ %55 خريجو كليات «College‏ 
7042 جامعي لم يكمل دراسته أو درس في معهد تقني 501706/اء16» جميعهم 
يعتقدون GL‏ التغير المناخي يحدث الآن وسببه الرئيس أنشطة إنسانية 
والتصميم cea pall‏ لاختبار F‏ في الجدول أعلاه؛ يؤكد على أن العلاقة بين 
التغير المناخي» ومستوى التعليم ذو معنوية إحصائية -(p=0.102)‏ 
الشكل )3.4( يعرض رسما بيانيا من نوع catplot‏ للمتغير warmop‏ 
موضحا الردود لكل مستوى تعليمي للمشاركين» معطيا نسبا åy gia‏ مرجحة. 
الخيار percent(educ)‏ يقوم بتصنيف النسب المئوية حسب فئات مستوى 
التعليم educ‏ والخيار title)‏ تم استخدامه كخيار فرعي مع المحدد by()‏ ولكي 
سيحدث بدون استخدام هذه الخيارات. 
-catplot hbar warmop [aweight = censuswt],‏ 
percent (educ)‏ 
by(educ,title("Personal belief about climate‏ 
change"))‏ 


blabel(bar, format (%3.0£)) ytitle("Weighted 
percent") 


Personal belief about climate change 


HS or less Tech/some coll 
DK/NA 10 DK/NA 12 
Not now M 5 Nol now 3 
Now/natural 34 Now/nalural 43 
N^whuman 51 Now/human 42 
College grad Postgrad 
DKNA M 5 DK/NA M 4 
Not now B 3 Not now § 2 
Now/nalural 37 Now/natural 25 
Now/numan 55 Nowhuman 69 
0 20 40 60 80 0 20 40 60 80 


Weighted percent 
Graphs by Highest degree completed 


الشكل )3.4( 


204 الإحصاء مع برنامج ستاتا 
مخططات الأعمدة البيانية للمقارنات اطتعددة : 


Bar Charts for Multiple Comparisons 





الرسم البياني للأعمدة catplot‏ في الشكل )3.4( يوضح العلاقة بين 
متغيرين» كل منهما يحتوي على أربع فئات. وإذا كان لدينا AÍ‏ من متغيرين 
أو sac‏ كبير من الفئات» فإن استخدام الأمر catplot‏ يصبح معقذاء Ja‏ 
الأكثر وضوحا لإجراء المقارنات المتعددة للمتغيرات هو استخدام الأمر 
hbar‏ لإنشاء الأعمدة الأفقية. 

الشكل )13.3( في الفصل السابق» تتبع التغيرات في جليد القطب 
الشمالي في نهاية فصل الصيف للفترة من 2011-1979 الانخفاض الكبير 
في نسبة الجليد جذب انتباه الكثير من العلماء وتم ملاحظته من قبل العامة في 
النشرات ووسائل الإعلام المختلفةء وقد قام مركز جرانيت لاستطلاع الرأي 
بتضمين سؤال (warmice)‏ تم صياغته بعناية لاختبار مدى معرفة الناس عن 
هذه المشكلة» مع إضافة هذا السؤال تم تغيير ترتيب الإجابات لتجنب التحيزء 
الأغلبية الساحقة )2671( تعلم عن انخفاض الجليد بالقطب الشمالي. 

أى من العبارات الثلاث التالية تعتقد أنها الأكثر دقة؟ 

خلال السنوات القليلة doll‏ الجليد في القطب الشمالي في نهاية 
الصيف: 
- يغطي منطقة أقل عن التي كان يغطيها منذ 30 سنة مضت. 
- انخفض ولكن عاد لنفس المنطقة تقريبا التي كان يغطيها منذ 30 سنة 


^ 


Nes Toc v 


- يغطي منطقة أكثر من التي كان يغطيها منذ 30 سنة مضت. 


-Svy: tab warmice, percent ci 


الفصل الرابع : بيانات الدراسات الاستقصائية 205 





(running tabulate on estimation sample) 


Number of strata = 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 








Arctic 
ice vs. 
30 years 


ago percentages 











Less 

Recovere 10.43 7.784 13.83 
More 6.916 4.941 9.789 
DK/NA 11.75 8.991 15.21 


Total 






Key: percentages = cell percentages 
1b = lower 95% confidence bounds for cell percentages 
ub = upper 95% confidence bounds for cell percentages 


“don’t know" "cà el Y" يسمح بأربعة خيارات تتضمن‎ 1warmice J) gus 

أو لا إجابةء وخدمة لبعض الأغراضء فإنه من المفيد إنشاء متغير جديد ذي 
تفرعين يشير إلى ما إذا كان المشاركون قد أجابوا عن السؤال بشكل صحيح» 
المتغير warmiceQ‏ يساوي 1 للإجابات التي قالت بأن الجليد انخفض» 0 لجميع 
الإجابات الأخرى» نحو %71 أجابوا بشكل صحيح» وكانت إجاباتهم أن الجليد 
في نهاية الصيف يغطي منطقة أقل من تلك التي كان يغطيها منذ 30 سنة 


- 


مضت . 


.gen warmiceQ = 0 

.replace warmiceQ = 1 if warmice== 

.label variable warmiceQ "Know Arctic ice area 
declined" d 

-Svy: tab warmiceQ, percent ci 
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تت ا ا ا ا س اك س وك Raus a‏ 


(running tabulate on estimation sample) 


Number of strata = 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 









Know 
Arctic 
ice area 


declined percentages lb ub 


- cell percentages 
lower 95% confidence bounds for cell percentages 
upper 95$ confidence bounds for cell percentages 


Key: percentages 
lb 
ub 


المتوسط )0,1( لمتغير معين warmiceQ Sia‏ يساوي نسبة من قيم 
1 الصحيح» فمثلاً المتغيرات الوهمية (0,1) لها العديد من الاستخدامات في 
النماذج الإحصائية. فعند إنشاء الرسومات البيانية فقد يتم إعادة قياس المتغير 
warmiceQ‏ لتكون قيمه 0 أو 100» فالمتغير الذي متوسطه )0,100( يساوي 
Luss‏ مئوية. وفي المثال أعلاه فهو يساوي النسب المئوية للإجابات الصحيحة 
حول الجليد في القطب الشماليء وعند تطبيق الأمرءهطط graph‏ على تقسيم 
ثنائى (0,100) فيمكننا مقارنة أشكال العديد من النسب المئويةء الشكل )4.4( 
يعرض النسب المرجحة للإجابات الصحيحة لخريجي الجامعات وخريجي 
المؤ oS Glu‏ ى (المتغير (college‏ 
-gen warmiceQ100 = warmiceQ*100‏ 


-graph hbar (mean) warmiceQ100 [aw - censuswt], 
over(college) 


blabel (bar, format (%3.0£) ) vtitle ("Weighted 
percent") 


title ("Arctic ice declined, by college 
grad/other") 
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EMEN‏ م اا AE‏ 


Arctic ice declined, by college grad/other 


Non college MEE 


College 





60 80 


40 
Weighted percent 


الشكل )4.4( 


لاحظ أن الرسم البياني للأعمدة الأفقية graph hbar)‏ وأيضاً في graph‏ 
chbox‏ وفي بعض الأشكال البيانية الأخرى التي تم تغيير اتجاهها) المحور 
الأفقي يسمى محور cy‏ وهذا مخالف لما هو متعارف عليه»ء لذا فإن 
ytitle(“Weighted percent")‏ يحدد gie‏ انا للمحور الأفقي وهو يظهر في 
أسفل الرسم. فبرنامج ستاتا لا يتعرآف على محور + في مثل هذه الأشكال 
بالرغم من أن الخيار( )1141416 يمكنه تحديد عنوان يظهر في الجانب الأيسر 
للشكل البياني. 

"شكل )4.4( يقارن بين نسبتين فقط وهي نسبة %76 التي Ba‏ نسبة 
خريجي الجامعات ونسبة 9665 التي تمثل خريجي المؤسسات الأخرى. لا 
ael.‏ أن el je] uii qual Whe che eli] ay land ellas‏ مكل ACA‏ 
المقارنة البسيطةء ولكن طريقة رسم الأعمدة يمكن تحسينها لإجراء مقارنات 
cabal alld lauded Jis‏ الاتنتقضنائية السايقة Gale,‏ أن متاك Las!‏ 
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متحيزة في العديد من الأسئلة التي تتعلق بالتغير المناخي» وقد توجد هذه 
المشكلة في السؤال السابق المتعلق بالجليد في القطب الشمالى. والشكل 
)5.4( يعرض أعمدة بيانية لثلاثة متغيرات تعطي نسبة الإجابات الصحيحة: 
وتم تقسيم هذه النسب لتمثل التعليم الجامعي والانتماء السياسي (متغير (party‏ 
.graph hbar (mean) warmiceQ100 [aw - censuswt],‏ 
over(college) over(party)‏ 

blabel(bar, format (%3.0f£)) ytitle("Weighted 
percent") 


title("Arctic ice declined, by college and 
political party", size(medium)) 


Arctic ice declined, by college and political party 


Non college 
Democrat 





College 


Non college 
Independent 
College 





Non college 
Republican 





College 


0 


20 80 


. 40 60 
Weighted percent 
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لكل مجموعة أحزاب بالمتغير «party.‏ يمكننا أن نرى تاثير التعليم 
الجامعي ولكل مستوى تعليمي؛ يمكننا أيضا أن نرى الاختلافات المتحيزة. 
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الشكل (5.4) لا يستطيع أن يوضح لنا أن الاختلافات هى اختلافات 
إحصائية ذات معنوية إحصائية» فالإجابة عن ذلك تتطلب استخدام d‏ ات النماذج 
الإحصائية التي سوف يتم تقديمها في الفصل (9)؛ كما سبق وأن رأيناء فإن 
نموذج الانحدار اللوغاريتمي المرجح يؤكد بأن كلا من المتغير college‏ والذي 
يمثل التعليم الجامعي؛ والمتغير party‏ والذي يمثل الانتماء السياسي لها تأثيرات 
إحصائية ذات Ay gine‏ وهذا التأثير موجب في حالة college‏ (0 > غير الجامعي 
yall = 1 «non-college‏ يج الجامعي (college grad‏ وسالب في حالة party‏ )] - 
الديمقراطي «Democrat‏ 2= للمستقل «Independent‏ 3 = للجمهو ري «(Republican‏ 
والانتماء السياسي عامل تنبؤي أقوى من college‏ 


.Svy: logit warmiceQ college party 


(running logit on estimation sample) 


Survey: Logistic regression 


Number of strata z 1 Number of obs = 501 
Number of PSUs = 501 Population size = 500.96122 
Design df = 500 
Fi 2. 499) = 16.07 
Prob >F ^ = 0.0000 







Linearized 
Coef. Std. Err. t P»|t| [95$ Conf. Interval) 








warmiceQ 




















college 
party 
cons 






.4634607 .2264922 2.05 .018467 .9084544 
-.6669759 .1268445 -5.26 0.000 -.9161897 -.4177621 
2.058491 . 3 6.51 1.437052 2.679931 









سوف نعود لهذا المثال في الفصل 6D‏ حيث سوف يتم تطبيق طريقة 
إحصائية (اللوغاريتم المتعدد) ويمكن إدراجها في نموذج تنبؤ لكل إجابة عن 
السؤال الخاص بمناطق الجليد. 


cm, 


gr oup) 
الملخصات الاخصائية والجداول‎ 


Summary Statistics and Tables 








الأمر ‘summarize‏ يقوم بإنشاء إحصائيات وصفية مختصرة متل 
الوسيط والمتوسط والانحراف المعياري للمتغيرات. وهناك طرق أخرى 
لإنشاء الملخصات الإحصائية للمتغيرات الأخرى» وذلك باستخدام الأمر 
4 بالنسبة للمتغيرات الطبقية والترتيبية» فإن الأمر tabulate‏ يقوم 
بإنشاء جدول للتوزيع ces Sal‏ والجداول التقاطعية» ومجموعة من 
الاختبارات» وقياسات للعلاقات» كما يمكنه Laf‏ إنشاء جداول أحادية أو 
ثنائية للمتوسطات والانحرافات المعيارية في شكل فئات للمتغيرات الأخرى. 
الأمر العام لإنشاء الجداول “table”‏ هو مقدمة لستة أنواع من الجداول» 
تحتوي خانات هذه الجداول على إحصائيات مشل التكرارات والمجاميع 
والمتوسطات والوسيطء. وأخيرا سوف نراجع إجراءات المتغير الواحد» وهي 
تتضمن اختبارات الاعتدال والتحويلات وعرض تحليل البيانات الاستطلاعية 
(EDA)‏ وأغلب التحليلات التي يغطيها هذا الفصلء يمكن القيام بها من خلال 
الأوامر أو من خلال القوائم وذلك باختيار Statistics » Summaries,‏ 
-tables & tests‏ 

بالإضافة إلى هذه التحليلات العامةء يقوم ستاتا بإنشاء العديد من الجداول 
التي لها أهمية خاصة gal‏ علماء الأوبئةء وقد قام الكاتبب Selvin‏ )2004( 
بالتطرق لهذا الموضوع بالتفصيل. 


أمثلة عن الأوأمر : Example Commands‏ 





.summarize yl y2 y3 
يقوم هذا الأمر بحساب ملخص للإحصائيات (المتوسطات والانحرافات‎ 
المعيارية وأعلى وأقل قيمة وعدد المشاهدات) للمتغيرات المدرجة بالأمر.‎ 
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.summarize yl y2 y3, detial 
lau aac Mua ASI Ales! Glues اء‎ AYN كوم هذا‎ 
مئوية والوسيط والمتوسط الحسابي والانحراف المعياري والتباين والالتواء‎ 
والتفرطح.‎ 
.Summarize yl if x1>3 & !missing(x2) 
مستخدما المشاهدات التي‎ y] يقوم بتحديد ملخص لإحصائيات المتغير‎ 
x2 قيمتها أكبر من 3 للمتغير 7+ والمشاهدات الموجودة (غير المفقودة) للمتغير‎ 
.summarize y1 [fweight = w], detail 
باس تخدام‎ y] يقوم بحساب ملخصات إحصائية أكثر تفصيلاً للمتغير‎ 
w الأوزان التكرارية في المتغير‎ 
.tabstat y1, stats(mean sd skewness kurtosis n) 
yl يقوم بحساب الإحصائيات التي تم تحديدها بين الأقواس للمتغير‎ 
.tabstat yl, stats(min p5 p25 p50 p95 max) by(x1) 
25 قيمةء المئين 65 والمئين‎ JÉ) حساب ملخصات إحصائية محددة‎ 
X] مستخدما فئات المتغير‎ y] وهكذا) للمتغيرات‎ 
.tabulate x1 
x] للتوزيع التكراري لكل القيم الموجودة للمتغير‎ Y يعرض جدو‎ 
.tabulate x1, sort miss 
يتضمن القيم المفقودة» ويتم‎ x] يعرض جدول توزيع تكراري للمتغير‎ 
ترتيب الصفوف (القيم) من أعلى تكرار إلى أقل تكرار.‎ 
.tabl x1 x2 x3 x4 
يعرض سلسلة من جداول التوزيع التكراري بحيث يتم إنشاء جدول‎ 
تكراري لكل متغير.‎ 
.tabulate x1 x2 
يعرض جدولاً تقاطعياً لمتغيرين» بحيث إن المتغير 1× يكون في صفوف‎ 
الجدول» والمتغير 2× يكون في' الأعمدة.‎ 


-tabulate x1 x2, chi2 nof column 7 
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يقوم بإنشاء جدول تقاطعي» وإجراء اختبار بيرسون ?1 للاستقلال» 
ولايعرض خلايا التكرارات ولكن يعطي عموذا للنسب في كل خلية. 
.tabulate x1 x2, missing row all‏ 
يقوم بإنشاء جدول تقاطعي يتضمن القيم المفقودة في الجدول وحسابات 
النسب المئوية» كما يحسب كل إحصائيات المتغيرات (بيرسون واحتمال X7‏ 
وقيمة  cCramér's Vjal SÀ‏ وقيمة جاما لجودمان وكروس كال Goodman and‏ 
cKruskal's gamma‏ قيمة «(Kendall iS) Te‏ 
.tab2 x1 x2 x4 x4‏ 
يقوم بإنشاء جدول تقاطعي ثنائي للمتغيرات المدرجة بالأمر. 
.tabulate x1, summ(y)‏ 
يقوم الأمر بإنشاء جدول أحادي يعرض المتوسط والانحراف المعياري 
والتكرارات لقيم المتغير برلكل فئة من فئات المتغير XJ‏ 
.tabulate x1 x2, summ(y) means‏ 
يقوم بإنشاء جدول تقاطعي ثنائي يعرض متوسط المتغير sic y‏ كل 
مرافق من قيم المتغيرات x1‏ والمتغير 2×. 
.by x3, sort: tabulate x1 x2, exact‏ 
يقوم بإنشاء جدول تقاطعي ثلاثي مع جداول فرعية للمتغير x)‏ (الصف) 
والمتغير x2‏ (عمود) عند قيمة من قيم المتغير ox‏ كما يقوم بحساب اختبار 
الدقة لفیشر Fisher's exact‏ لكل جدول فرعي. 
:by varname, sort JLI‏ يعمل كمقدمة لأغلب أو امر ستاتا عندما يكون 
له معنى» والخيار sort‏ غير ضروري إذا كانت البيانات مرتبة في المتغير 
226 


-table y x2 x3, by(x4 x5) contents (freq) 
x2 (صف) في المتغير‎ y يقوم بإنشاء جدول تقاطعي خماسي للمتغير‎ 
(عمود) في المتغير 3 (عمود فرعي) في المتغير 4× (صف فرعي 1( في‎ 
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المتغير 5د (صف فرعي 2) وجميع الخلايا سوف تحتوي على 
تكرارات. 
.table x1 x2, contents(mean 31 median y2)‏ 
يقوم هذا الأمر بإنشاء جدول تقاطعي ثنائي للمتغير /× (صف) في 
المتغير 2× (عمود)ء والخلايا سوف تتضمن المتوسط للمتغير y]‏ والوسيط 
للمتغير y2‏ 
.8vy: tab y, percent ci‏ 
يقوم هذا الأمر باستخدام البيانات المرجحة للدراسات الاستقصائية (التي 
e‏ تحديدها بالأمر (svyset‏ وإنشاء جدول ثنائي للنسبة المئوية للمتغير .رمع 
فترة ثقة %95. وللحصول على مزيد من المعلومات عن خيارات جداول 
بيانات الدراسات الاستقصائيةء قم بطباعة الأمر help svy tab‏ كما أن الفصل 
14 سيشرح بيانات الدراسات الاستقصائية وكيفية تحليلها. 
-8vy: tab y x, column percent‏ 
يقوم هذا الأمر باستخدام البيانات المرجحة للدراسة الاستقصائيةء وإنشاء 
جدول ثنائي مع صف للمتغير ر وعمود للمتغير × وعرض نتيجة اختبار 
الاستقلالية المعدل ur‏ وسوف تحتوي الخلايا على نسب مئوية 


مرجحة. 


المطلخصات الإحصائية لقياس الطتعيران : 
Summary Statistics for Measurement Variables‏ 
الملف electricity.dta‏ يتضمن بيانات و معلومات عن استهلاك الكهرباء 
شي الولايات المتحدة. وتم الحصول على هذه البيانات من مفوضية الطاقة 
بكاليفورنيا (2012). 


.use C:\data\electricity.dta, clear 
-describe 


-— 
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Contains data from C:\data\electricity.dta 
obs: 51 US states 
electricity use 
2010 (CA Energy 


Commission) 
vars: 7 2 Jul 2012 06:11 
size: 1,734 
storage display value 
variable name type format label variable label 
state str20 %20s State 
stateab str2 $9s State 
(abbreviation) 
region4 byte $9.0g reg4 Census Region (4) 
region9 byte $12.0g reg9 Census Division 
(9) 
pop long $8.0g Population, 1000s 
electric long %8.0g Electricity use, 
millions of kWh 
elcap int $8.0g Per capita 


electricity use, kWh 





Sorted by: state 


لإيجاد المتوسط والانحراف المعياري للاستخدام الفردي للكهرباء (elcap)‏ 
قم بطباعة الأمر: 


. summarize elcap 


variable Obs Mean Std. Dev. Min Max 





elcap 51 13318.43 4139.328 6721 27457 


الجدول أعلاه يوضح Laf‏ عدد المشاهدات الموجودة للمتغيرء ويعرض 
أعلى قيمة وأقل Aad‏ وإذا قمنا بطباعة الأمر summarize‏ بدون إضافة أي 
متغير» فسوف نحصل على المتوسطات والانحرافات المعيارية لكل متغير 
رقمي في البيانات. 

لمشاهدة تفاصيل ASÍ‏ عن الملخصات الإحصائيةء قم بطباعة الأمر 


.summarize elcap, detail 
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Per capita electricity use, kWh 


Percentiles Smallest 

1% 6721 6721 

5% 7434 7363 
10% 8286 7434 Obs 51 
25% 10359 7467 Sum of Wgt. 51 
50% 13388 Mean 13318.43 
Largest Std. Dev. 4139.328 

75% 16117 19477 
90% 17903 19896 Variance 1.71le+07 
95% 19896 21590 Skewness .7643711 
99% 27457 27457 Kurtosis 4.161063 


مخرجات الأمر :summarize, detail‏ تحتوي على إحصائيات أساسية 
بالإضافة إلى المعلومات التالية: 

المئينات: والملاحظ أن الربيع الأول (النسبة المئوية 25 = 10,359( 
والوسيط (النسبة المئوية 50 = 13,388( والربيع الثالث (النسبة المئوية 75 
= 16,117( وحيث إن العديد من العينات لايتم تقسيمها في شكل ربيعات او 
el jal‏ معياريةء فإن هذه النسب المئوية عبارة عن تقديرات. 

وهناك في الجدول أربع أعلى قيم» وأربع أقل قيم» حيث يمكن أن تظهر 
القيم المتطرفة ضمن هذه القيم. 

ومجموع الأوزان: الأمر summarize‏ يسمح للاأوزان التكرارية أو 
«fweight‏ ولمزيد من الشرح قم بطباعة الأمر -help weight‏ 

التباين: مربع الانحراف المعياري (الاحتمال الأكثر هو أن الانحراف 
المعياري يساوي الجذر التربيعي للتباين). 

الالتواء: وهو اتجاه ودرجة عدم التمائل في منحنى التوزيع ahil‏ لطبيعي» 
فالتوزيع الطبيعي المتماثل تماما هو التوزيع الذي يكون فيه الالتواء يساوي 
صفراء Ld‏ الالتواء الموجب (ذيل | لمنحنى أطول في الجانب الأيمن) يعني أن 
الالتواء أكبر من الصفرء أما الالتؤاء السالب (ذيل المنحنى أطول في الجانب 
الأيسر) يعني ol‏ الالتواء أصغر من الصفر. 
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التفرطح: وزن ذيل المنحنىء التوزيع الطبيعي (منحنى جاوس) يكون 
متماثلا عندما يكون التفرطح يساوي 3 أما إذا كان منحنى التوزيع أطول من 
الطبيعي» (مدبب بشكل كبير) فإن التفرطح أكبر من 3» Ul‏ إذا كان التفرطح 
أقل من 3 فإن هذا يشير إلى ذيل أقل من الطبيعي. 

الأمر itabstat‏ يعتبر Suu‏ أكثر مرونة للأمر summarize‏ حيث يمكننا 
تحديد الإحصائيات التي نريد حسابهاء فمثلاً: 





.tabstat elcap, stats(mean min max) 


variable mean min max 


elcap 13318.43 6721 27457 


باستخدام الأمر 24 مع الخيار by(varname)‏ يمكننا إنشاء جدول 
يحتوي على الملخصات الإحصائية لكل قيمة من قيم cvarname‏ المثال أدناه 
بترم وإقاء جنول dad‏ و علي وان فة nemo‏ ل zx‏ 
للكهرباء بشكل منفصل لكل إقليم من الأقاليم الأمريكية الأربعة في التعداد 
السكاني» حيث إن استخدام الكهرباء يُعتبر منخفضاً في الشمال الشرقي 
Northeast‏ ومر Lait‏ في الجنوب South‏ والنصف الغربي „Midwest‏ 


-tabstat elcap, stats(mean min max) by (region4) 


Summary for variables: elcap 
by categories of: region4 (Census Region (4)) 


region4 



















Northeast 
Midwest 
South 
West 


8746 
14151.5 10516 19477 
16001.06 11343 21590 
12206.92 








13318.43 " 

بالإضافة إلى المتوسط mean‏ وأقل قيمة min‏ وأعلى قيمة max‏ هناك 
إحصائيات أخر ى متوافرة مع الخيار stats)‏ والأمر tabstat‏ تتضمن 
المجموعة التي سبق استخدامها سابقا مع الأمر collapse‏ والأمر graph bar‏ 
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(p99 والمئينات من 1م إلى‎ count, sum, max, min, variance, sd, Six) 
التحكم في شكل الجداول‎ WDE وهناك خيارات إضافية أخرى يمكن من‎ 
بهذه الخيارات» قم بطباعة الأمر‎ ALAS وتوصيفاتها. وللحصول على قائمة‎ 
-help tabstat 

الإحصائيات التي تم إنشاؤها بواسطة الأمر «summarize‏ أو pe‏ 
4 تقوم بشرح وصفي cáil‏ وخدمة لبعض الأغراض «ga!‏ فإننا 
قد نقوم بتحديد فترة ثقة للاستدلال عن المجتمعات الكبيرة» وكما تم شرحه 
سابقاء فإنه يمكننا الحصول على فترة 4 %99 لمتوسط المتغير elcap‏ 

.ci elcap, level(99) 
Variable Obs Mean Std. Err. [99$ Conf. Interval] 
elcap 51 13318.43 579.6218 11766.32 14870.54 

في بيانات العينة الموجودة لديناء فإنه يمكننا التأكد بنسبة 9699 أن 
متوسط المجتمع يكون في فترة الثقة إذا كانت قيمته بين 11,766 إلى 
0 كيلووات في الساعة للفرد الواحدء وبشكل أكثر دقة فإنه في العديد 
من العينات العشوائيةء فترات الثقة التي يتم إنشأؤها بهذه الطريقة يجب أن 
يكون متوسط مجتمعها نحو 9605 عند اختيار العينةء فالخيار level(99)‏ يحدد 
أن فترة الثقة تساوي 9699( وإذا قمنا بإهمال هذا الخيارء فإن الوضع 
الافتراضي ci OU‏ هو اختيار %95 كفترة ثقة. 

الخيارات الأخرى تسمح للثمر eb‏ بحساب فترة ثقة محددة للمتغيرات 
التي تتبع توزيع ذي الحدين أو توزيع بواسون» والأمر المتعلق بهذه 
الحسابات هو cii‏ الذي يقوم بحساب فترات A‏ مباشرة للتوزيع الطبيعي 
وتوزيع ذي الحدين وتوزيع بواسون وذلك من الملخصات الإحصائية. 
وللحصول على تفاصيل عن هذه الأوامرء قم بطباعة الأمر -help ci‏ 


الإحصائي Joh Tukey‏ جمع مجموعة من الأدوات للطرق الحديثة والقديمة 
لتحليل البيانات الاستكشافي. وهي تتضمن تحليل البيانات بطريقة استكشافية بدون 
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إجراء أي افتراضات غير ضرورية (انظر Tukey; Mosteller and Tukey‏ 1977 
3 ,1985( فرسومات الصندوق التي تم شرحها في Jail‏ )3( تعتبر أكثر 
الأشكال البيانية استعمالا في تحليل البيانات الاستكشافي؛ وهناك طريقة أخرى 
وهي عرض الساق والورقة» وهي طريقة جغرافية لترتيب قيم البيانات» بحيث إن 
الأرقام الأولية تعتبر هي الساقء وباقي الأرقام لكل مشاهدة تعتبر الأوراق. 


.Stem elcap 


Stem-and-leaf plot for elcap (Per capita electricity use, kWh) 


6*** | 721 
2*** 363,434,467,952 

8*** | 286,514,591,696,982,985 
9--* 

10*** 106,359,516,739 

11*** 253,343,395,759 

12*** 077,159,379,497,845,904 
137** 388,557,916,992 

14*** | 179,263,325,345,475,489,578 
15*** 048,568 

16*** 117,293,315,519,793 
17*** | 290,293,903 

18*** 852 

19*** 477,896 

20*** 

217*7 590 

22*** 

23*** 

24*** 

25*** 

26*** 

27*** 457 


في هذا العرضء أقل قيمة لاستهلاك الكهرباء a jill‏ الواحد هي 6,721 
(كاليفورنيا) Cus‏ تظهر قيمة 721 كورقة للساق ***6 وأعلى قيمة 
7 (ويمينج) تظهر كورقة 7 للساق ***27» فالأمر stem‏ يقوم 
تلقائياً باختيار القيم للساق» ويمكنه تجاوز هذا باستخدام الخيار line)‏ ولمزيد 
من المعلومات حول هذا الخيار قم بطباعة الأمر -help stem‏ 

الأمر dv‏ : يستخدم إحصائيات مرتبة لشرح التوزيع. 

.lv elcap 
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[1 51 Per capita electricity use, kWh 
M 26 13388 spread pseudosigma 

F 13.5 10437.5 13140 15842.5 5405 4131.039 
E 7 8514 12903.5 17293 8779 3894.835 
D 4 7467 13472 19477 12010 4098.322 
6 2.5 7398.5 14070.75 20743 13344.5 3866.579 
B 1.5 7042 15782.75 24523.5 17481.5 4369.45 
1 6721 17089 27457 20736 4689.655 

# below # above 

inner fence 2330 23950 0 1 
outer fence -5777.5 32057.5 0 0 


في الجدول M odel‏ يشير إلى الوسیط F‏ الربيعات (الربيمات 
باستخدام تقدير مختلف عن تقدير الربيعات الذي تم استخدامه في الأوامر 
(summarize, detail, tabsum‏ أما «D «E‏ © ... تشير إلى النقاط الفاصلة Sie‏ 
8/1« 16/1« 32/1 . وع anal‏ خارخ rams‏ هد منحنى التوزيع» 
الأرقام بالعمود الثاني توضح المسافة أو العمق من أقرب نهاية لكل قيمة 
حرفيةء LÍ‏ الجزء الأوسط في الجدول فهو يتضمن ثلاثة أعمدة العمود 
الأوسط يوضح متوسطات قمتين حرفيتين؛ إذا انتقلت هذه القيم بعيداً عن 
الوسيط كما حدث في المتغير elap‏ فإن هذا يعني أن التوزيع أصبح ذا التواء 
مرتفع» وأصبح يتجه أكثر نحو ذيل منحنى التوزيع؛ ويكون التشتت مختلفا 
بين نوعين من القيم الحرفية. Stud‏ التشتت بين ad‏ ۴ يساوي تقريبا المدى 

بين الربيعات؛ ial;‏ العمود الأخير في ` الجانب الأيمن in pseudosigma‏ 
بتقدير الانحراف المعياري الذي من المفترض إذا كانت القيم الحرفية تشر 
مجتمع جاوس» قيم ۴ في العمود الأخير pseudosigma‏ في الجانب me‏ 
aie ERN‏ عليها الانحراف المعياري الوهمي (PSD)‏ وهو يفحص عينة ما 
وقيمها المتطرفة لتقدير طبيعة التوزيعات المتمالة: 
las sil A1 ja —1‏ مع الوسيظ (pound‏ الالتواء بشكل lS‏ 

Gia ge el gill المتوسط > الوسيط‎ 

المتوسط = الوسيط متمائل 

od d disi Ss A‏ اف 
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2- إذا كان المتوسط والوسيط متشابهين» فهذا يشير إلى أن التوزيع متمائل. 
لذا فإن المقارنة بين الانحراف المعياري والانحراف المعياري الوهمي 
(PSD)‏ تساعد في تقييم طبيعة ذيل منحنى -التوزيع الطبيعي: 
التوزيع الطبيعي <PSD‏ ذيل منحنى التوزيع أكبر من الطبيعي 
التوزيع الطبيعي = PSD‏ ذيل منحنى التوزيع طبيعي 
التوزيع الطبيعي >PSD‏ ذيل منحنى التوزيع أقل من الطبيعي 
لنفرض أن Fy‏ وو تشيران إلى الربع والثلاثة أرباع (تقريباً الربيع 

الأول والربيع الرابع) فإن المدى IOR gens!‏ يساوي و iP, acil‏ 

.1.349 على‎ Lagusa JOR يساوي‎ PSD والانحراف المعياري ي الوهمي‎ 
(هناك‎ oia; وقطررفا‎ fala. là js ad pli القيم‎ Lai Shy, الو‎ 

قيمة واحدة متطرفة تطرفا بسيطا في توزيع المتغير ممءاه) يمكننا أن نسمى 

القيمة × 'قيمة متطرفة تطرفا بسيطا" عندما تبرز خارج الحد الداخلي وليس 

الحد الخارجي: 

F; + 1.5IQR<x > F; + - ÍF- 3IQR <x «F, - ٠ 0F 
تبرز خارج الحد الخارجي:‎ Laie "als, القيمة 'قيمة متطرفة تطرفاً‎ 
x>Fy+3IOR gl X<F,-3/0R 
يوضح هذه الحدودء كما يوضح أعداد القيم المتطرفة لكل نوع؛‎ Iv الأمر‎ 
وهي القيم التي تقع خارج الحدود الخارجية وهي‎ lala القيم المتطرفة تطرفاً‎ 
نادرة الحدوث (نحو 2 لكل مليون) في المجتمعات الطبيعية» تطبيقات محاكاة‎ 

مونت كارلو تشير إلى أن وجود أي قيمة متطرفة في العينات التي حجمها n‏ 

150 = إلى 20,000 = n‏ يفترض أن يكون Lits Suh‏ لرفض فرضية Du‏ 

-a = 0.05(Hamilton 1992b) عند‎ normality hypothesis 
جميعها تؤکد أن توزيع العينة للمتغير‎ summarize, stem, lv الأو أمر‎ 

elcap‏ له التواء موجب» ولا يشبه منحنى التوزيع الطبيعي النظري. الجزء 

التالي من هذا الفصل»ء سوف يشرح اختبارات الاعتدال بشكل أكثر تفصيلاء 

والتحويلات التي يمكن أن تقلل من التواء المتغيرات. 
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احتبارات الاعندال والتحويلات : 


Normality Tests and Transformations 


العديد من الاختبارات الإحصائية تكون ذات $e lS‏ عندما يتم تطبيقها 
على متغيرات تتبع التوزيع الطبيعي. الجزء التالي سيشرح طرق استكشاف 
لفحص الاعتدال التقريبي» واستخدام أدوات الرسم البياني (المدرج التكراريء 
ورسم الصندوق» وشكل التماثل» وأشكال الربيعات) التي تم شرحها في 
الفصل 3» واختبارات الالتواء والتفرطح موضحا لإحصائيات الالتواء 
والتفرطح عند استخدام الأوامر summarize, detail‏ التي يمكنها تقييم فرضية 

العدم وهي أن العينة تم الحصول عليها من مجتمع موزع توزيعا طبيعياً. 
.Sktest elcap‏ 


Skewness/Kurtosis tests for Normality 





joint 
Variable Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 





elcap 51 0.0223 0.0723 7.49 0.0236 


sktest jayi‏ يرفض الاعتدال: المتغير elap‏ يظهر غير طبيعي بشكل 
ملحوظ حيث إن الالتواء (0-0.0223) بالرغم من أن التفرطح )0.723 = (p‏ 
وكلتا الإحصائيتين (الالتواء والتفرطح) معا (0.0236 = «p‏ 

اختبارات الاعتدال الأخرى تتضمن طرقا لحساب إحصائية W‏ لشابيرو 
ويلك Shapiro-Wilk W(swilk)‏ و إحصائية W^‏ لشابيرو فرانسيا Shapiro-‏ 
Francia(sfrancia)‏ (لمزيد من المعلومات قم بطباعة الأمر «(help sktest‏ 
نموذج ستاتا لحساب اختبارات حلقات دورنيك هانسن Doornik-Hansen‏ 
للاعتدال الأحادي والمتعدد متوافرة على الإنترنت (قم بطباعة الأمر findit‏ 
-(omninorm‏ 

التحويلات اللاخطيّة مثل الجذور التربيعية واللوغاريتمات يتم استخدامها 
عادة لتغيير أشكال uis‏ وذلك Jaa Gags‏ التواء التوزيعات أكثر تماثلاء 
وأقرب للتوزيع الطبيعي. التحويلات قد تساعد في جعل العلاقة بين 
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المتغيرات علاقة خطيّة (الفصلان 7 و8. الجدول )5 (T:‏ رصن اقا نم 
alu‏ القوى Tukey)‏ 1977) وهو يوضح دليلاً لاختيا ر التحويلات التي تقوم 
cea ay CIRCE‏ اترا NS Unga Linge‏ فاك 
جذره التربيعي قد يكون متماثلاء ويمكننا إنشاء متغير جديد يساوي الجذر 
التربيعي للمتغير elcap‏ وذلك بطباعة الأمر التالي: 


.generate srelcap = elcap ^.5 





وبدلا من كتابة 5.^ elcap‏ يمكننا كتابة -sqrt(e/cap)‏ 


اللوغاريتمات هي عبارة عن تحويل أخر يمكنه تخفيض الالتواء 
الموجب» و لإنشاء متغير (ogelcap) ia‏ يساوي اللوغاريتم الطبيعي للمتغير 
elcap‏ يمكننا طباعة الأمر: 
.generate logelcap = ln(elcap)‏ 
في سلم القوى وطرق التحويل ذات الصلة مثل بوكس-كوكس 
واللوغاريتمات فهي تأخذ مكان قوة 0« وهذه الطرق لها تأثير متوسط على 
شكل التوزيعء وهذا التأثير يتراوح ما بين 0.5 (الجذر التربيعي) و0.5- 
(عكس الجذر التربيعي) للتحويلات. 
جدول (1.5): سلم القوى 


المكعب 3 = new‏ | تخفيض الالتواء السالب الحاد 
التربيع 2 = new‏ | تخفيض الالتواء السالب البسيط 
بيانات خام 4 | لا يوجد تغيير (بيانات (ald‏ 
الجذر التربيعي 5 = new‏ | تخفيض الالتواء الموجب البسيط 


- اللوغاريت‎ 
" 2o. | new = In(old) ريدم‎ 
تخفيض الالتواء الموجب‎ new laglü(old) (nud) j 


سالب عكس الجذر التربيعي | [new =-(0ld*5)‏ تخفيض الالتواء الموجب الحاد 
. المتبادلة السالبة new =- (old^-1)‏ | تخفيض الالتواء الموجب الحاد 
مربع المتبادلة السالبة new =- (old^-2)‏ | تخفيض الالتواء Gas gall‏ الحاد 
مكعب المتبادلة السالبة new = - (old^-3)‏ | تخفيض الالتواء الموجب الحاد 
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قمنا بأخذ القيم السالبة للنتيجة بعد رفع الأس AY‏ من صفر. وللحفاظ 
على الترتيب الأصلي للبيانات» فإن أعلى قيمة في المتغير القديم old‏ سوف 
يتم تحويلها إلى أعلى قيمة في المتغير الجديد new‏ وهكذاء وعند احتواء 
المتغير old‏ على قيمة سالبة 3 e yia‏ فإنه من الضروري إضافة ثابت قبل 
el yal‏ عملية Stud ehaill‏ إذا كان المتغیر arrests‏ يقوم بقياس عدد Cl yall‏ 
التي تم فيها اعتقال شخص ما (وهناك قيمة صفر للعديد من الأشخاص) فإنه 
من الأفضل استخدام اللوغاريتم لإجراء التحويل. 
.generate logarrest - ln(arrests + 1)‏ 
الأمر ladder‏ : يجمع alu‏ القوى مع الأمر sktest‏ للاعتدال» وهو يحاول 
استخدام كل قوة في السلم» ويفصح Lac‏ إذا كانت النتيجة غير طبيعية بشكل 
كبير. يمكن توضيح ذلك باستخدام الالتواء الموجب في المتغير «elcap.‏ والذي 
يحتوي على بيانات استهلاك الكهرباء لكل فرد بملف البيانات electricity.dta‏ 
.ladder elcap‏ 


Transformation formula chi2(2) P (chi2) 
cubic elcap^3 44.12 0.000 
Square elcap^2 26.24 0.000 
identity elcap . 7.49 0.024 
Square root sqrt (elcap) 1.21 0.547 
log log(elcap) 0.26 0.879 
l/(square root) 1/sqrt (elcap) 2.36 0.307 
inverse 1/elcap 4.87 0.088 
l/square 1/(elcap^2) 10.67 0.005 
l/cubic 1/(elcap^3) :د‎ 17.51 0.000 


الجذر التربيعي ومعكوس الجذر التربيعي ومعكوس التحويلات جميعها 
تقوم بتقريب التوزيعات آلتي لا تختلف بشكل كبير عن التوزيع الطبيعي. في 
هذا الصددء فإن التحويلات هي عبارة عن تطويرات تت تتم pas‏ علبي 
البيانات الخام التي تختلف عن التوزيع الطبيعي بدرجة كبيرة (p70.024)‏ من 
الواضح أن اللوغاريتمات تعتبر أفضل jua‏ للتحويل الطبيعي الشكل )5 (i‏ 
والذي تم إنشاؤه بواسطة gladder b.‏ يعطي Gi aes‏ لوذه A uu‏ 
وذلك من خلال مقارنة المدرجات التكرارية لكل عملية تحويل إلى منحنى 
التوزيع الطبيعي>-. 


-gladder elcap 
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Histograms by transformation 


الشكل )1.5( 


ISA‏ )2.5( يعرش Ae gene‏ متقابلة من Akl) cua ga jJ‏ لتحويلات 
سلم القوى. تم إنشاء هذه الأشكال بواسطة أمر سلم الربيعات :gladder‏ 
jal)‏ 3 يد من المعلومات عن ladder, gladder, qladder‏ قم بطباعة 
الأمر dead s «(help ladder‏ الرسونناك: ey ESE ek aN‏ في 
المثال أدناه» يمكننا جعل قياس التوصيفات والرموز في الرسم تظهر e—‏ 
نسبته 9625 من حجمها الأصليء وذلك عن طريق استخدام الخيار 
scale(1.25)‏ وتوصيفات المحاور (والتي قد يصعب قراعتها تكلا لتزاحمهيا) 
تم إخفاؤها عن طريق استخدام الخيار ylabel(none) xlabel(none)‏ 


.qladder elcap, scale(1.25) ylabel (none) 
xlabel (none) 
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1/cubic 





Per capita electricity use, kWh 
Quantle-Normai plots by transformation 


الشكل )2.5( 


هناك طريقة à‏ بديلة للتحويل يطلق عليها بوكس - كوكس ‘Box-Cox‏ وهي 
توفر تدرجا أفضل بين bed‏ وآلية الاختيار فيم بين هذه المتغيرات 
(وهي سهلة للمحللء ولكنها ليس دائما الطريقة الأفضل) الأمر beskewü"‏ 
وجد بأن قيمة 3 (لمدا) للتحويلات 

أو: 

y = 126) 2-0 

القيمة مثل < في العادة لها قيمة التولؤها يساوي صفرًا تقرييا؛ 
وبتطبيق ذلك على للمتغير elap‏ يمكننا الحصول على متغير جديد يكون 
اسمه belcap‏ وذلك عن طريق طباعة الأمر التاني: 

-bcskew0 belcap = elcap, level(95) 


Tansl Z 1999 colt - vali Skewness 
SLD I=L | .2$Zl:26l. -.82£5847€ .878423£2— 3.75e-7E 
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المعادلة )145 belcap-(elcap" 5- DA.‏ تقوم بالتحويل لجعل التوزيع 
أكثر ere Sts‏ من إحصائية الالتواء المطلوبةء بارامتر بوكس — 
كوكس 0.145 ene CDD‏ (الذي كان 
مرفوعاً للأس 0( وكانت فترة الثقة ل ۸ تتضمن 0 (لوغاريتم) ولكن لا 
تتضمن 1 (لا تغيير): 
0.827«2.«0.878- 
الفصل )8( يشرح طريقة كوكس - بوكس لنموذج الانحدار بطريقة 


الجداول التكرارية.. والجداول التقاطعية الثنائية : 


Frequency Tables and Two-Way Cross-Tabulations 


الملخصات الإحصائيةء والرسومات البيانية» والتحويلات التي سبق 
شرحها يمكن تطبيقها بشكل أساسي على المتغيرات القابلة للقياس. أما 
gall id od‏ فنتظلي لوقا ig al‏ في ag satel‏ باستهدام islam‏ أحافية 
أو ثنائية. وبالعودة إلى بيانات مركز جرانيت بالملف Granite2011_6.dta‏ 
هناك سؤال (mrackus)‏ عن ماذا كان الناس يعتقدون أن الولايات المتحدة تسير 
في الاتجاه الصحيح» أو أنها في الاتجاه الخطأ؟ بالرغم من أن هذا السؤال 
يبدو غامضاء وتمت صياغته بطريقة غريبة» ولكنه سؤال تقليدي يُستخدم في 
استطلاعات الرأي بالولايات المتحدة لقياس المزاج العام للمواطنين» أغلبية 

المواطنين بولاية نيوهامبشير أظهروا تشاؤمهم عن وضع البلاد. 
.tabulate trackus‏ 


US right 
direction or - 









wrong track Percent 


Right direction 
Wrong track 
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الأمر tabulate‏ : يمكنه إنشاء جداول تكرارية للمتغيرات التي تحتوي 
على GY!‏ القيم. وقبل إنشاء جداول توزيع تكراري لمتغير معين يحتوي 
على العديد من القيم» فإننا نحتاج إلى تصنيف هذه القيم باستخدام الأمر 
generate‏ مع الخيار recode‏ والخيار autocode‏ (لمزيد من المعلومات عن 
الأمر generate‏ انظر الفصل 2 أو قم بطباعة الأمر .(help generate‏ 
نقوم باستخدام الأمر tabulate‏ يليه أسماء متغيرين اثنين لإنشاء جدول 
تقاطعي. ad‏ لإنشاء جدول تقاطعي للمتغير trackus‏ مع المتغير educ‏ 
(مستوى التعليم لدى المشاركين بالدراسة) نقوم بطباعة الأمر: 
-tabulate eductrackus‏ 


US right direction or 
wrong track 
Right dir Wrong tra 





Highest degree 
completed 






Total 










HS or less 
Tech/some coll 

College grad 
Postgrad 


110 
142 


اسم المتغير الأول سوف يمثل الصفوف» والمتغير الثاني يمثل الأعمدة 
في الجدول» من الجدول أعلاه يمكننا أن نرى أن 71 من 107 مشارك في 
الدراسة مستواهم التعليمي الثانوية العامة أو أقل Hs or less‏ يعتقدون بأن 
الولايات المتحدة تسير في الاتجاه الخطأ. 

oS,‏ السؤال: هل وجهات النظر rackus‏ لها علاقة بالمستوى التعليمي؟ 
وللإجابة عن cell‏ يمكننا إجراء اختبار كاي تربيع *#ء واختبار نسب 
الضف COM‏ المتغير educ‏ - والذي يظهر في صفوف الجدول - يمثل المتغير 
المستقل في هذا الاختبارء الخيار row‏ يحدد النسب المئوية للصفوفء والخيار 
nof‏ يعني عدم إظهار التكرارات. 


.tabulate educ trackus, row nof chi2 


sd 
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US right direction or 
wrong track 
Right dir Wrong tra 












Highest degree 
completed 





HS or less 
Tech/some coll 

College grad 
Postgrad 


100.00 
100.00 











Total 37.47 62.53 | 100.00 


Pearson chi2(3) = 12.7549 Pr - 0.005 


نحو %69 من المشاركين في الدراسةء لديهم مؤهل علمي تقني أو كلية 
Tech/some coll‏ يعتقدون أن الولايات المتحدة في الاتجاه الخطأء ولكن حملة 
الشهادات العليا postgrad‏ يبدو cus SEE Js eei‏ إن نسبة %48 منهم 
يعتقدون نفس الاعتقاد. وبناءً على هذه العينة يمكننا أن نرفض فرضية العدم» 
وهي عدم وجود علاقة بين المتغير educ‏ والمتغير trackus‏ في مجتمع 
الدراسة بولاية هامبشير (0.005 = (X? = 12.75, p‏ 

الأمر tabulate‏ به العديد من الخيارات المفيدة التي تساعد في إنشاء 
الجداول الثنائية. هذه الخيارات تتضمن اختبارات بديلة (اختبار الدقة لفيشرء 
معدل الإمكان ?2( ومقاييس العلاقات (قيمة Lela‏ لجودمان وكروسكال «C‏ 
وكندال تاو أ Ta‏ » ومعامل ارتباط كريمر (V.‏ الخيار missing‏ يحدد Gl‏ القيم 
المفقودة يجب تضمينها في صفوف أو أعمدة الجدولء الأمر tabulate‏ يمكنه 
حفظ التكرارات» وأسماء المتغيرات كمصفوفةء لمزيد من المعلومات عن هذه 
الخيارات قم بطباعة الأمر .help tabulate‏ 

أحياناً قد نحتاج إلى sate}‏ تحليل الجداول المنشورة بدون الرجوع إلى 
البيانات الأصلية. هناك أمر خاص وهو tabi‏ (الجدول الفوري) يقوم بهذه 
المهمة. قم بطباعة تكرارات الخلايا.في سطر الأمر مع فصل صفوف 
الجدول بعلامة ١”‏ “» لشرح كيفية قيام الأمر tabi‏ بإعادة إنشاء الجدو J‏ 
التقاطعي ما قبل السابق مباشرة من تكرارات الخلايا بدون الرجوع إلى أي 
بيانات: 
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NCC dt‏ ات usi codd E‏ 


.tabi 36 71 ١ 34 76 ١ 49 93 ١ 56 52 





Pearson chi2(3) = 12.7549 Pr = 0.005‏ 
وللقيام بنفس التحليل» وعرض النسب المئوية للصفوف. واختبار كاي 
تربيع x‏ 


.tabi 36 71 ١ 34 76 ١ 49 93 ١ 56 52, row nof 22 


.00 





Pearson chi2(3) = 12.7549 Pr - 0.005‏ 
الأمر tabi‏ : يختلف عن الأمر tabulate‏ في أنه لا يتطلب وجود أي 
بيانات في ذاكرة برنامج ستاتاء وعند إضافة الخيار replace‏ يمكننا جعل 
الأمر tabi‏ يقوم باستبدال أي بيانات في الذاكرة بالبيانات الجديدة التي تظهر 
في الجدول التقاطعىء الخيارات الإحصائية ...chi2, exact, nofreq)‏ الخ) 
تقوم بنفس المهام مع الأمر tabi‏ التي قامت بها من قبل مع الأمر tabulate‏ 
ولمزيد من المعلومات قم بطباعة الأمر l -help tabulate twoway‏ 
حتى الآن كل الأمثلة التي تم شرحها في هذا الجزءء لا تتضمن أوزانا 
مرجحةء وكما تم شرحه سابقاً في الفصل (4) فإن الباحثين في الدراسات 
الاستقصائية في العادة يطبقون الأوزان المرجحة بعناية فائقةء وذلك لجعل 
نتائج العينة ممثلة للمجتمع المستهدف» المتغير censuswt‏ يمشل الأوزان 
المرجحة لبيانات استطلاع الرأي التي جمعها مركز جرانيت؛ وتم اس تخدام 

الأمر svyset‏ للتأكيد Gl‏ هذه الأوزان هي أوزان احتمالية. 
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.Svyset [pw = c 
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ensuswt] 


الأوامر التي تبدأ ب : svy‏ سوف تقوم بتطبيق الأوزان الاحتمالية svyset‏ 
بشكل تلقائيء أما بالنسبة للأوامر الأخرى» فإنها تتجاهل الأوزان» وسوف 
نسرد بعض الأمثلة عن الأوزان الاحتمالية في الجداول الثنائية. 


.Svy: tab track 


us 


(running tabulate on estimation sample) 


Number of strata = 
Number of PSUs = 








US right 
direction 
or wrong 


track proportions 







Right di 
Wrong tr 






Total 


Key: proportions - 


1 
472 


Cell proportions 


.Svy: tab eductrackus, row percent 


(running tabulate on estimation sample) 


Number of strata 
Number of PSUS 






Highest 
degree 
completed 


US right di 





HS or le 


Tech/som 24.5 
College 36.41 
Postgrad 53.41 

Total 37.26 


Key: row percentages 


Pearson: 
Uncorrected chi2( 
Design-based 9م"‎ 


467 






rection or wrong 
track 





Right di Wrong tr Total 











15.5 100 
63.59 100 
46.59 100 
62.74' 100 


3) E 
9, 1394.32)- 


21.3629 
5.9918 


Number of obs z 472 
Population size = 474.80568 
Design df = 471 
Number of obs = 467 
Population size = 469.25491 
Design df = 466 


P = 0.0005 
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في الجدول الذي يعرض الأوزان المرجحة؛ يمكننا أن نرى الفرق الكبير 
في التشاؤم بين المشاركين في الدراسة وبين الذين يحملون مؤهل المعهد 
التقني أو لم يُكملوا الجامعة Tech/some‏ )9675.5 يعتقدون أن الولايات 
المتحدة في الاتجاه الخطأ) والذين يحملون مؤهلات دراسات عليا )9646.6 
يعتقدون .أن الولايات المتحدة في الاتجاه ai]‏ التصميم tly‏ على اختبار F‏ 
عطي نتائج مناظرة للجدول المرجح لاختبار كاي تربيع. اختبار Sy F‏ أن 
العلاقة بين المتغير educ‏ والمتغير 5 هي علاقة إحصائية ذات معنوية 
.(p = 0.005)‏ 
الجداول اطتعدده.. والجداول النقاطعية اطتعدذة : 
Multiple Tables and Multi-Way Cross-Tabulations‏ 
عند العمل مع الدراسات الاستقصائية والبيانات الكبيرة» فإننا Label‏ 
نحتاج إلى التوزيعات التكرارية للعديد من المتغيرات المختلفة. وبدلا من 
إنشاء كل جدول بشكل منفصل في كل i ja‏ يمكننا استخدام أمر آخر خاص 
وهو -tabl‏ 
.tabl tparty Obama trackus‏ 
ولإنشاء جداول تكرارية أحادية لكل متغير من party‏ وحتى المتغير 
اء« في هذه البيانات (في المرة الواحدة يمكنك استخدام 30 متغيراً كحد 
أقصى) قم بطباعة الأمر 


x 


etabl tparty-obama 

وبالمثل» فإن الأمر tab2‏ يقوم بإنشاء جداول ثنائية» فمثلا الأمر التالي 
يقوم بإنشاء جداول تقاطعية ثنائية لكل متغير 

.tab2 tparty obama trackus 

والأمر tabl‏ والأمر tab2‏ يستخدمان الخيارات التي يستخدمها الخيار 

-tabulate 
ولإنشاء جداو ل احتمالية متعددة؛ فإنه من الممكن استخدام الأمر‎ 
قبل الأمر. فعلى سبيل المثالء لإنشاء جدول‎ by المحدد‎ as مع‎ tabulate 
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تقاطعي أحادي عن المشاركين الذين قاموا بانتخاب الرئيس أوباما في سنة 
8 وعما إذا كان خريجو كليات أو لاء نقوم بطباعة الأمر التالى: 


.tab obama college, col nof chi 





Voted for 
Obama in College graduate 
2008 Non colle- College Total 





Pearson chi2(ff"- 20.2966 Pr = 0.000‏ 
وهناك طريقة واحدة لإنشاء جدول تقاطعي ثلاثي لمتغخير «Obama‏ 
والمتغير college‏ وعلاقتهما بمتغير الجنس csex‏ وذلك باستخدام الأمر sort‏ 
والمُحدد cby‏ حيث يقوم هذا المحدد بإنشاء جداول ثنائية بنفس تنسيق الجداول 
أعلاهء ولكن بشكل منفصل- للذكور والإناث. j‏ 


.Sort sex 
-by £ex: tab obama college, col nof chi 





-» sex - Male 


Voted for 
Obama in College graduate 
2008 Non colle College Total 





Peż¿. „on chi2(1) = 14. 988 Pr = 0.000 


-> sex = Fema’ 


^^liece graduate 
ile College Total 





Pearson chi2(1) = 7.2227 Pr - 0.007 


234 الإحصاء مع برنامج ستاتا 


العلاقة بين المتغيرين Obama‏ و college‏ ذات معنوية؛ وفي نفس الاتجاه 
للجدولين cole!‏ ولكن يظهر أن العلاقة AS)‏ قوة بين الرجال (حيث إن نسبة 
خريجي الجامعة تمثل 25 نقطة 9 إلى 9655.12( عن النساء )16 
نقطة فرق» 45.38 إلى %61.79( 


هذه الطريقة يمكن استخدامها لإنشاء جداول أكثر تعقيداء Was‏ لإنشاء 
SEEN‏ تقاطعي رباعي للمتغير obama‏ & المتغير college‏ مع جداول فرعية 
للرجال والنساء المتزوجين وغير المتزوجينء يمكننا طباعة الأمر التالي a)‏ 
يتم عرض نتائج هذا الأمر): 


.sort sex married 
.by sex married: tab Obama college, col nof chi 


مثل هذا الجدول المتعدد يصنف البيانات في عينات فرعية يكون فيها 
التباين أكثر قوة. 
هناك طريقة أخرى لإنشاء الجداول المتعددة فإذا كنا لا نحتاج إلى 
النسب المئوية أو الاختبارات الإحصائية» فإنه يمكننا استخدام الأمر العام 
لإنشاء الجداول وهو table‏ فهذا الأمر له عدة مزايا وعدة خيارات» تم 
عرض eja‏ بسيط منها «baad‏ ولإنشاء جدول ثنائي للمتغير obama‏ مع 
المتغير college‏ مع تكرارات في كل خلية نقوم بطباعة الأمر التالي: 
-table obama college, contents (freq)‏ 








Voted for 
Obama in 
2008 


College graduate 
Non college College 


إذا قمنا بزحديد متغير طبقي IG‏ فسوف يتم إنشاء أعمدة فرعية في 
جدول ثلاثي كمأ يلي: 


‘table obama college sex, contents (freq) 


a d 
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Voted for Gender and College graduate 
Obama in Male - — Female —————— 
2008 Non college College Non college College 


الجداول الأكثر تعقيدا تتطلب استخدام الخيار gly by()‏ يمكنه استخدام 
أربعة متغيرات فرعية أخرىء» لذا فإن الأمر table‏ يمكنه إنشاء جدول لسبعة 
متغيرات (عمود واحد وصف واحد وعمود فرعي واحد وأربعة صفوف 
فرعية) ويتم إنشاء ذلك الجدول كما يلي: 


.-table obama college sex,contents(freq) by(married) 










Responden 
t married 
and Voted 
for Obama 
in 2008 


Gender and College graduate 
—— —— — Male 


LLL — Female 
Non college College 


Non college College 





الأمثلة أعلاه استخدمت الأمر table‏ وقامت بوضع التكرارات في خلايا 
الجداول»ء ولكن الأمر table‏ يتيح لنا إنشاء ملخصات إحصائيةء فمثلا الجدول 
الرباعي للمتغير ات obama x college x sex x married‏ يحتوي في كل خلية 
على متوسط العمر age‏ لمجموعة من الخصائص» حيث ندرى أن 34 لم 
يتخرجوا في الكلية non-college‏ رجال غير متزوجين لم يصوتوا لأوباما 
ومتوسط أعمازهم 46.6 سنة: 


‘table obama college sex, contents(mean age) 
by (married) 
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Responden 
t married 
Gender and College graduate 















and Voted 

for Obama Male E Female ERS 
e 

in 2008 Non college College Non co iege 












60 
61.78378 


60.64706 
63.21053 


46.91667 
53.45454 






46.63636 
55.6 















52.35484 
53.80769 


58.2 
53.21053 


55.92857 
55.87234 


الخيار contents()‏ مع الأمر table‏ يحدد الإحصائيات التي 3 تحتويها خلايا 
الجدول. . الخيارات لا تتضمن التكرارات أو المتوسطات فقط وإنما تتضمن 
أيضا الانحراف المعياري» وأعلى Aad‏ وأقل Aad‏ والوسيطء والمدى؛ 
والنسب المئوية» وملخصات أخرى. وللحصول على قائمة كاملة بهذه 
الخيارات قم بطباعة الأمر help table‏ الجزء التالي من هذا الفصل. سوف 
يشرح بعض الاحتمالات الخاصة بالملخصات الإحصائية بالجداول. 


جداول اطتوسطات والوسيط واملخصات الإحصائية الأخرى : 


Tables of Means, Medians and Other Summary Statistics 
يقوم بإنشاء جداول للمتوسطات» والانحراف المعياري‎ tabulate الأمر‎ 
على شكل فئات للمتغيرات. بالنسبة للأمثلة المتبقية في هذا الفصل» سوف نعود‎ 
يعرض‎ tabulate لاستخدام بيانات استهلاك الكهرباء بالولايات المتحدة؛ الأمر‎ 
طريقة واحدة لمشاهدة الملخصات الإحصائية لمعدل استهلاك الكهرباء لكل فرد‎ 

-(region9) المتحدة‎ GLY لكل إقليم في التعداد السكاني بالو‎ (elcap) 
«tabulate region?9, summ(elcap) 






Census Summary of Per capita electricity 
Division use, kWh 
(9) Mean Std. Dev. Freq. 


New Engla 
Mid Atlan 
E N Centr 
W N Centr 
S Atlanti 
E S Centr 
W S Centr 
Mountain 
Pacific 













8417.1667 532.95419 
9403.6667 2175.4139 
12726.2 2174.5595 
15169.571 2172.0833 
15011.889 2810.0798 
17948.25 2475.1953 
16279.5 1965.8288 
13877.5 5723.3327 
9534 3073.2846 





تن )€ ص ل- ضا gà‏ تش QD‏ كا |( 






13318.431 
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كما يمكننا استخدام الأمر tabulate‏ لإنشاء جداول ثنائية للمتوسطات كما 
في هذا المثال» باستخدام تقسيمات الأقاليم الموجودة بالتعداد السكاني للولايات 
المتحدة: 


.tabulate region9 region4, summ(elcap) mean 


Means of Per capita electricity use, kWh 






Census 






Census Region (4) 
Midwest South 


Division 
(9) 







Northeast Total 






















New Engla 8417.1667 8417.1667 
Mid Atlan 9403.6667 2 9403.6667 
E N Centr 12726.2 12726.2 
W N Centr 15169.571 ; 15169.571 
S Atlanti 15011.889 15011.889 
E S Centr 17948.25 17948.25 
W S Centr 16279.5 : 16279.5 
Mountain 13877.5 13877.5 

Pacific 9534 9534 







13318.431 





14151.5 16001.059 12206.923 





الخيار mean‏ : في الأمر أعلاه يحدد بأن الجدول يجب أن يحتوي على 
المتوسطات فقط وإذا لم نقم باستخدام هذا الخيار فإننا سوف نحصل على 
جدول ضخم يحتوي على المتوسطات والانحراف المعياري والتكرارات في 
كل خلية. 
الأمر fable‏ : مرن ويستخدم عند إنشاء جداول لسبعة متغيرات» ويحتوي 
الجدول على المتوسطات والانحراف المعياري» والمجاميع. caia gll‏ 
وإحصائيات أخرى. ولشرح cells‏ فإن الجدول أدناه syle‏ عن جدول أحادي 
يعرض المتوسطء والانحراف المعياري لاستهلاك الكهرباء للفرد coal gll‏ كما 
يعرض Lad‏ المدى الربيعي للمجتمع لكل إقليم بالتعداد السكاني. 
.table region9, contents‏ 
(mean elcap sá elcap median pop iqr pop)‏ 
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Census 


Division (9) mean (elcap) sd(elcap) med (pop) iqr (pop) 








8417.17 532.9542 
9403.67 2176.414 12702 10586 














New England 
Mid Atlantic 





E N Central 12726.2 2274.56 9884 5053 
W N Central 15169.6 2172.083 2853 4490 
S Atlantic 15011.9 2810.08 5774 7682 
E S Central 17948.3 2475.195 4559.5 1910 
W S Central 16279.5 1965.829 4142 11506 
Mountain 13877.5 5723.333 2380 2618 
Pacific 4 3073.285 






معدل استهلاك الكهرباء للفرد الواحد يتباين نتيجة لعامل من اثنين» فهو 
معدل منخفض يساوي 8,417 كيلووات/ساعة في نيوإنجلاند إلى معدل 
مرتفع 8 كيلووات/ساعة في وسط الجنوب الغربي (هذا يتضمن 
الولايات المنتجة للنفط وهي تكساس ولويزيانا وأوكلاهوما). ومن ناحية 
أخرى» فإن أعلى تباين حدث في الولايات الجبلية. حيث إن الانحراف 
المعياري )5,723 كيلووات/ساعة) أعلى بعشر مرات عنه في ولاية 
نيو إنجلاند )533 كيلووات/ساعة). 

الخيار ‘contents()‏ في الأمر cable.‏ يحدد الإحصائيات التي يجب أن 
تظهر في كل خلية لكل متغير. الإحصائيات التي يمكن إدخالها تتضمن أعلى 
قيمة وأقل قيمة والمجموع والنسبة والمئينات وعدة أنواع من الأخطاء 
المعيارية. للحصول على قائمة بهذه الخيارات قم بطباعة الأمر table‏ ماعط. 
استخدام الاوزان التكرارية Using Frequency Weights:‏ 


الأوامر summarize, tabulate, tabe‏ وعدة أوامر أخرىء يمكن 
استخدامها مع الأوزان التكرارية التي تشير إلى عدد المشاهدات المتكررة. 
فمثلاً المتوسط والإحصائيات الأخرى لاستهلاك الفرد للكهرباء بالولايات 
المتحدة كما يلي: 
.summ elcap‏ 
Variable Obs Mean sta; Dev. Min Max‏ 


elcap 51 13318.43 4139.328 3 6721 27457 
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المتوسط 13,318 كيلووات/ساعة hay‏ متوسط استهلاك الكهرباء في 51 
lui Ly) Aj;‏ ضاحية Lua JI‏ العامة واشنطن): ويم Jie!‏ كلو A‏ وحدة 
واحدة» ولاية وايومنج Wyoming‏ التي بها أقل aac‏ سكان )564 ai‏ نسمة) 
وأعلى معدل لاستهلاك الكهرباء للفرد الواحد (27,457 كيلووات/ساعة). أما في 
ولاية كاليفورنيا California‏ التي بها أكبر عدد سكان (37 مليوناً) وأقل معدل 
لاستهلاك الكهرباء للفرد الواحد (6,721 كيلووات/ساعة) كل ولاية لها نفس 
daa fadi clas die c jl‏ للولايات 451 lae adl qas gly‏ 0-8 22-3 نحي 

الولايات المتحدة «JSS‏ فإنه يجب القيام بوزن عدد السكان. 
-summ elcap [fweight = pop]‏ 


Variable Obs Mean Std. Dev. Min Max 
المتحدة‎ SLAY glo المتوسط المرجح لاستهلاك الكهرباء لعدد السكان‎ 
13,318( كيلووات/ساعة) أقل من متوسط 51 ولاية‎ 12,114( 
كيلووات/ساعة) بسبب كثرة عدد السكان الذين يعيشون في الولايات ذات‎ 
New York ونيويورك‎ California كاليفورنيا‎ Sis الاستهلاك المنخفض للكهرباء‎ 
عن عدد السكان في الولايات ذات الاستهلاك المرتفع للكهرباء مثل وايومنج‎ 


.)3.5 (الشكل‎ Kentucky وولاية كنتاكي‎ Wyoming 
‘graph twoway scatter elcap pop, mlabel(state) 


9 Wyoming 


© Kentucky 


ERAF Lg سد‎ 


٠. : 3 Carolina 
e fous anomna MUT 


emi ومس ان‎ ana © Texas 
60 la 
VENIS. sin Ce PTS d Flonda 


BIEN مو ملاع‎ © Michigan 


dence‏ كم و 
misland S New York‏ 


0 10000 20000 30000 40000 


Per capita electricity use, kWh 


10000 15000 20000 25000 30000 


© Califorrua 


5000 





Population, 1000s 


الشكل )3.5( 
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المتوسط الموزون بعدد السكان لاستهلاك الكهرباء للفرد الواحد يمكن 
شرحه كمتوسط لعدد سكان الولايات المتحدة بالكامل والبالغ 309 ملايين 
Aani‏ ويجب ملاحظة أنه لا يمكننا القيام بحساب انحراف معياري موزون 
أو أعلى قيمة أو أقل قيمةء وذلك بسبب أن أغلب الإحصائيات الفردية لايمكن 
کا مذ اناك مور 1439 Seah ae gts YN‏ كاله datas] Gate‏ يدو 
مع الأوزان»ء LAY‏ ذات معنى مع نوع معين من التحليل؛» ولكنها نادرأ ما 
يكون لها معنى مع البيانات ككل عند استخدام أنواع مختلفة من التحليل. 

الأوزان التكرارية تقوم بنفس العمل مع الأمر tabulate‏ والأمر table‏ 
الأمر أدناه يقوم بحساب المتوسط الموزون لعدد السكان لكل إقليم» وبهذا 
يمكننا أن نأخذ في الاعتبار الولايات ذات الكثافة السكانية d SI)‏ حيث 
يمكننا أن نرى من الجدول أدناه أن أصغر متوسط لاستهلاك الكهرباء في 
إقليم الباسفيك „Pacific‏ 


‘table region9 [fweight = pop], contents (mean 
elcap) row 







Census 


Division (9) mean (elcap) 














New England 8486.42 


Mid Atlantic 9127.38 
E N Central 12444.7 
W N Central 14374.9 

S Atlantic 13891.4 
E S Central 17819.2 
W S Central 15092.9 

Mountain 11816.9 
Pacific 8089.04 
Total 12112.7 





الخيار row‏ : يحدد أن الصف الأخير يلخص الجدول USS‏ فالمتوسط 
العام في هذا الجدول يساوي (12,112.7 كيلووات/ساعة) هو نفس المتوسط 
الذي حصننا عليه سابقاً عند استخدام الأمر summarize‏ 


C9) fed’ 
تحليل التباين وطرق المقارنة الأخرى‎ 


Anova and Other Comparison Methods 





تحليل التباين ANOVA‏ يتضمن مجموعة من الطرق لاختبار الفرضيات 
حول الأختلافات بين- المتوسطات: ويمكن: تظبيق هذا التطليل على lites‏ 
واسع يمتد من التحليلات البسيطة التي يمكننا من خلالها المقارنة بين متوسط 
المتغير ر من خلال فئات المتغير × » وحتى التحليلات المعقدة مع المتغيرات 
التصنيفية المتعددة والمتواصلة للمتغيرات. اختبار ؛ للفرضيات المتعلقة 
بمتوسط فردي Aue)‏ واحدة) أو بزوج من المتوسطات (عينتان) ترتبط 
بالأشكال الابتدائية لتحليل .ANOVA‏ 

الاختبارات اللامعلمية التي تعتمد على الرتب» The‏ اختبار مان ees‏ 
واختبار كروسكال واليزء لها طريقتها المختلفة لمقارنة التوزيعات. هذا 
الاختبار يقوم بافتراضات ضعيفة حول القياس وشكل التوزيع والانتشار. 
ولكن تظل هذه الاختبار صالحة إذا توافر لها عدد كبير من الشروط أكثر من 
تلك التي يتطلبها تحليل التباين وعناصره المعلمية. أحياناً قد يقوم المحللون 
باستخدام الاختبارات المعلمية واللامعلمية لفحص ما إذا كانت النتائج تسير 
فى اتجاه متشابه» وإذا اختلفت نتائج الاختبارات المعلمية عن نظيراتها 
اللامعلميةء فيجب محاولة الكشف عن هذا الاختلاف» ومحاولة معرفة أسبابه. 

الأمر ه«مده: هو yal gl así‏ ستاتا النموذجيةء فهو مثله مشل الأوامر 
TESI‏ يعتبر bye‏ بدرجة كبيرة» ويتضمن عددا كبيرا من النماذج. فالأمر 
Gil su anova‏ مع تحليل التباين الأحادي والمتعددء كما أنه متوافق مع التغاير 
(ANCOVA)‏ للتصميمات المتوازنة وغير المتوازنة بما فيها الخلايات 
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المفقودة» كما أنه متوافق مع التصميمات العامليّة» والتصميمات التجريبية 
المتشابكة والتصميمات ALKA oll‏ وتصاميم القياسات المتكررة. أحد الأوامر 
التابعة الأخرى هو الأمر predict‏ الذي يقوم بحساب القيم ال dx‏ لعدة أنوا ع 
من (ull gall‏ وعدة أخطاء (As lize‏ والإحصاءات التشخيصية. eu,‏ استخدام 
هذا الأمر بعد الأمر .anova‏ الأمر الآخر التابع هو test‏ ويقوم بحساب 
الاختبارات التي يحددها المستخدم لاختبار فرضية العدم. الأمر test‏ والأمر 
predict‏ يعملان بنفس الطريقة مع أوامر ستاتا eg AVI‏ التي تتوافق مع 
النماذج مثل الأمر regress‏ الذي (سيتم شرحه في Jail‏ 7). 
خيارات قوائم ستاتا أدناه تؤدي إلى القيام بأغلب الإحصائيات التي تم 
شرحها في هذا الفصل وهي كما يلي: 
Statistics > Summaries, tables, & tests > Classical tests of‏ 
hypotheses‏ 
Statistics » Summaries, tables, & tests » Nonparametric tests of‏ 
hypotheses‏ 
Statistics > Linear models and related > ANOVA / MANOVA‏ 
Statistics > Postestimation > Predictions residuals, etc.‏ 
Graphics > Twoway graph (scatter, line etc.)‏ 
أمثلة عن الأوامر : Example Commands‏ 
anova y x1 x2‏ 
يقوم بحساب تحليل التباين الثنائي» موضحا الاختلافات بين متوسطات 
المتغير ر من خلال تصنيفات المتغير 1× والمتغير 22. 
.anova y x1 2‏ 
يقوم بحساب تحليل التباين العاملي ذي الاتجاهين» الذي يتضمن 
التأثيرات الأساسية والتفاعلية (x14x2)‏ للمتغيرات التصنيفية 6x25 x1‏ كما 
يمكن تحديد نفس النموذج بالضبط باستخدام الرمز العاملي عن طريق الأمر 
anova y xI##x2‏ حيث إن (##) لا يسمح فقط بتفاعل ##22/+ وإنما يسمح 
Lad‏ بأي نوع من أنواع تأثيرات المستوى المنخفض والتأثيرات الأساسيةء 
Las‏ فيها .هذه المتغيرات: "E‏ هذا المثال البسيطء هناك تأثيرات أساسية لكل 


(x2 3Xl من‎ 
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.anova yx1##x2##x3 
يقوم بحساب تحليل التباين العاملي ذي التلاتة اتجاهات» وهذا يتضمن‎ 
تلاثة اتجاهات لتفاعل المتغير ات 2##×3×##/× بالإضافة إلى كل التفاعلات‎ 
(x1, x2, x3) والتأثيرات الأساسية‎ (x1Hx2, x 8x3, x2#x3) الثنائية‎ 
.anova reading curriculm / teacher/curriculm / 
يقوم بصياغة نموذج تجريبي متشابك مناسب لاختبار تأثيرات ثلاثة‎ 
«(reading) أنواع من المناهج 7 على قدرة الطلبة على القراءة‎ 
curriculm(teacher|curriculum) المعلم متشابك مع المنهج‎ teacher و المتغير‎ 
دليل المستخدم‎ «uela لأن مجموعات مختلفة من المعلمين تم تخصيصهم لكل‎ 
يوضح مع الأمثلة النماذج التجريبية المتشابكة‎ Base Reference Manual 
الأخرى للتباين» كما يتضمن أيضا تصميم القطع المنفصل.‎ 


.anova headache subject medication, 
repeated(medication) 


يقوم بجعل نموذج التباين للقياسات المتكررة متناسباً لاختبار تأثيرات 
AS‏ أنو اع من علاج الصداع (medication)‏ على شذة الصداع «(headache)‏ 
استخدم أنواع العلاج الثلاثة في أوقات مختلفة أثناء الدراسة. 
.anova y xl x2 c.x3 c.x4x2ic.x3‏ 
.regress‏ 
يقوم بحساب التغاير (ANCOVA)‏ لأربعة متغيرات مستقلة» منها اثنان 
تصنيفيان (x7, x2)‏ واثنتان متصلتان (x3, x4)‏ وبما في ذلك التفاعل بين 
ax2ilcax3‏ الأمر الذي يليه وهو regress‏ بدون إضافة أي متغيرات وهو يقوم 
بإنشاء جدول لنتائج الانحدار. 
.kwallis y, by(x)‏ 
يقوم بحساب اختبار كروسكال jb,‏ لاختبار فرضية العدم للمتغير ty‏ 
الذي له توزيع مرتب متشابه لعدد الفئات + للمتغير x‏ حيث إن (2</). 
-oneway y x $‏ 
يقوم بحساب تحليل التباين الأحادي (ANOVA)‏ مختبرا الفروقات بين 
المتوسطات للمتغير برمع فئات المتغير cx‏ نفس التحليل > مع اختلاف جدول 
النتائج - يمكن القيام به باستخدام الأمر -anova y x‏ 
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.oneway y x, tabulate scheffe 
متضمنا جدول مخرجات‎ ANOVA يقوم هذا الأمرء بحساب تحليل التباين‎ 
-Scheffé لمتوسطات العينةء واختبارات المقارنة المتعددة لشافيه‎ 
.ranksum y, by(x) 
يُعرف‎ LS) يقوم هذا الأمرء بحساب اختبار مجموع الرتب لويلكوكسن‎ 
ay المتغير‎ led مان وتني) لفرضية العدم والتي يكون‎ U أيضا باختبار‎ 
توزيعات رتب متشابهة لفئات المتغير الثنائي ×. وإذا فرضنا أن توزيعات‎ 
y الرتب لها نفس الشكل فهذا يُضيف اختبارا عما إذا كان الوسيطان للمتغير‎ 
متساويين.‎ 
.Serrbar ymean se x, scale(2) 
يقوم برسم أعمدة بيانية تمثل الخطأ المعياري من بيانات المتوسطات.‎ 
الخطاً‎ se يتضمن مجموعة المتوسطات للمتغير ب والمتغير‎ ymean المتغير‎ 
ees يحدد‎ scale(2) والخيار‎ ox يمثل قيم فئات المتغير‎ x المعياري» المتغير‎ 
امتداد الأعمدة البيانية يجب أن يكون ±2 للخطأ المعياري حول كل متوسط‎ 
(£1 (الوضع الافتراضي هو‎ 
-Signrank yl = 2 
للأزواج المتطابقة ورتب‎ Wilcoxon يقوم بإجراء اختبار ويلكوسن‎ 
ويمكننا‎ y2 والمتغير‎ y] الإشارة الذي يختبر تساوي توزيعات الرتب للمتغير‎ 
مثل 23.4 وذلك‎ Au يختلف عن قيمة‎ y] اختبار ما إذا كان الوسيط للمتغير‎ 
signrank y/=23.4 بطباعة الأمر‎ 
-Signtest yl = y2 
يختبر تساوي الوسيط للمتغير /بر والمتغير 2ر (بافتراض أن بيانات‎ 
حيث القياس ونفس مشاهدات العينة)» استخدام الأمر‎ (ye المتفيزيق متشابية‎ 
سوف يعرض اختبار الإشارة لفرضية العدم» وهي أن وسيط‎ signtest y] — 5 
.5 المتغير 1ر يساوي‎ 
.ttest y = 5 


eee 
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يقوم بإجراء اختبار ١‏ لعينة واحدة لفرضية العدم التي تفترض بأن 
متوسط المجتمع للمتغير y‏ تساوي 5 
.ttest y1 = 2‏ 
يقوم بإجراء اختبار ١‏ لعينة واحدة (الاختلاف المترابط) لفرضية العدم 
التي تفترض Gh‏ متوسط المجتمع للمتغير /بريساوي نظيره للمتغير y2‏ 
الوضع الافتراضي لهذا الأمر يفترض Gl‏ البيانات مترابطةء فعند اس تخدام 
بيانات غير مترابطة (تم الحصول على بيانات المتغيرين y25 yl‏ من عينتين 
مستقلتين) فيجب إضافة الخيار .unpaired‏ 
.ttest y, by(x) unequal‏ 
يقوم هذا الأمر بإجراء اختبار ١‏ لعينتين لاختبار فرضية العدم التي 
يجب أن يُفترض gh‏ المجتمعات لها تباين متساو (بدون استخدام الخيار 
unequal‏ فإن الوضع الافتراضي للأمر ttest‏ هو اعتبار التباين متساويا 
للمجتمعات). 
ol uil‏ العينة One-Sample Tests : olo)‏ 
يبدو أن اختبار y‏ للعينة الواحدة له sac‏ تطبيقات منها: 
1 - اختبار ما إذا كان متوسط العينة ¥ يختلف بشكل ملحوظ عن القيمة 
المفترضة Hy‏ 
2- اختبار ما إذا كانت متوسطات المتغير ,بر والمتغير Lad 5 y;‏ متغيران تم 
قياسهما بنفس المقياس عند جمع قيم المشاهدات ولكنهما يختلفان عن 
بعضهماء وهذا يكافئ اختبار ما إذا كان متوسط متغير نتيجة الاختلاف 
تم إنشاؤه بواسطة طرح ,بر من y)‏ يساوي صفر. 
يمكننا استخدام نفس المعادلات للتطبيقات أعلاه بالرغم من أن التطبيق 
الثاني يبدأ بمعلومات عن متغيرين اثنين بدلا من متغير واحد. 
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ملف البيانات 7 يحتوي على معلومات تم جمعها لتقييم دورات 
الكتابة بالجامعة tU‏ على معالجة الكلمات (دراسة Nash and Schwartz‏ 
7 القياسات - Sia‏ عدد العبارات الكاملة في الوقت المحدد - تم جمعها 
قبل وبعد إتمام الطلبة للدورة. الباحثون يريدون معرفة ما إذا كانت القياسات 
بعد الدورة شهدت أي تطور. 

.use C:\data\writing.dta, clear 





.describe 

Contains data from C:\data\writing.dta 

obs: 24 Nash and Schwartz (1987) 

vars: 9 2 Jul 2012 06:11 

size: 216 

storage display value 

variable name type format label variable labei 
ی‎ ee ر‎ X JC ————)£ س ال‎ HÓ 
id byte %8.0g slbl Student ID 
pres byte $8.0g # of sentences (pre-test) 
preP byte $8.0g # of paragraphs (pre-test) 
prec byte $8.0g Coherence scale 0-2 (pre-test) 
preE byte $8.0g Evidence scale 0-6 (pre-test) 
posts byte %8.0g # of sentences (post-test) 
postP byte %8.0g # of paragraphs (post-test) 
postc byte %8. 0g Coherence scale 0-2 (post-test) 
postE byte 58 . 09 Evidence scale 0-6 (post-test) 
Sorted by: 


QUAS] asa IS الماضدية‎ Anal الطلية خلال‎ of ca ji d Gol ai 
الطالب للعبارة هو 10 عبارات» وقبل اختبار مدى تطور مهاراتهم خلال‎ 
الدورة قد نحتاج إلى معرفة مهاراتهم عند بداية الدورة. بعبارة أخرى نحن‎ 
يختلف بدرجة‎ (preS) نحتاج إلى معرفة ما إذا كان متوسط العينة قبل الدورة‎ 
كبيرة عن متوسط الطلبة السابقين (10). وللحصول على اختبار ؛ لعينة‎ 

واحدة لفرضية العدم 0- = Hosp‏ نقوم بطباعة الأمر التالي: 
.ttest pres = 0‏ 


One-sample t test 








Variable Obs Mean Std. Err. Std. Dev. (95% Conf. Interval) 











24 10.79167 -9402034 4.606037 8.846708 12.73663 





mean 


mean (pres) 


" = t= 0.8420 

o: mean = 0 ° degrees of freedom = 23 
Ha: mean « 10 Ha: mean !- 10 ~~ Ha: mean > 10 

Pr(T « t) = 0.7958 Pr(|T| > [t|) = 0.4084 Pr(T » t) - 0.2042 
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الرمز Pr(T<t)‏ يعني "احتمال أن قيمة توزيع  dil‏ من قيمة / المشاهدة 
إذا كانت Hy‏ صحيحة" وهذا في حالة اختبارالاحتمال لطرف واحدء Ld‏ اختبار 
الاحتمال لطرفين لقيمة + المطلقةء فإن ذلك يعني 0.4084 = Pr([T[»|t])‏ وحيث 
إن الاحتمال مرتفع فليس لدينا أي سبب لرفض Ho: Z0‏ ويجب ملاحظة 
أن الأمر ttest‏ يقوم بالاختبار معتبرا أن فترة الثقة للمتوسط تساوي 695 
وفترة الثقة هذه تتضمن قيمة فرضية العدم 10« ويمكننا أن نرى فثترة ثقة 
مختلفة - %90 متلا — إذا استخدمنا الخيار level(90)‏ مع الأمر أعلاه. 
النظيراللامعلمي - اختبار التصميم - يستخدم توزيعاً ثنائياً لاختبار 
فرضيات عن ad‏ وسيط أحادية. فمثلا يمكننا اختبار ما إذا كان الوسيط 
للمتغير preS‏ يساوي 10« الأمر signtest‏ يوضح بأنه لا يوجد سبب لرفض 
فرضية العدم. 
.Signtest pres = 10‏ 
Sign test‏ 


sign observed expected 










positive 
negative 
zero 


10 11 





One-sided tests: 


Ho: median of preS - 10 - 0 vs. 
Ha: median of preS - 10 » 0 
Pr(#positive >= 12) = 
Binomial(n = 22, x >= 12, p = 0.5) = 0.4159 
Ho: "median of preS - 10 = 0 vs. 
Ha: median of preS - 10 « 0 
Pr(#negative >= 10) = 
x >= 10, p= 0.5) = 0.7383 


Binomial(n = 22, 


Two-sided test: 
Ho: median of preS - 10 = 0 vs. 
Ha: median of preS - 10 != 0 
Pr(#positive >= 12 or #negative >= 12) = 
min(1, 2*Binomial(n = 22, x >= 12, p = 0.5)) = 0.8318 
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الأو امر مثل الأمر ttest‏ و الأمر signtest‏ تتضمن ill‏ الأيمن والذيل الأيسر 
لمنحنى التوزيع والاحتمالات الثنائية» على خلاف توزيعات ؛ المتماثلة التى 
استخدمها الأمر ttest‏ فإن التوزيعات الثنائية التي يستخدمها الأمر La signtest‏ 
شكل مختلف للذيل الأيسر والذيل الأيمن لمنحنى التوزيع. في هذا المثال الاحتمال 
التنائي هو المهم لديناء وذلك لأننا نريد اختبار ما إذا كانت بيانات الطلبة بالملف 
0 تختلف عن فرضية العدم وهي أن الوسيط يساوي 10. 
OY!‏ سوف نقوم باختبار التطور خلال الدورة وذلك باختبار فرضية 
العدم التي تفترض Gh‏ متوسط عدد العبارات التي يمكن إكمالها قبل وبعد 
الدورة (متوسط المتغير preS‏ ومتوسط المتغير post‏ متساويان)» الأمر ttest‏ 
يقوم بهذا الاختبار» ويوضح gh‏ هناك تطورا ملحوظا. 
.ttest postS = pres‏ 


Paired t test 








Variable Obs Mean Std. Err. Std. Dev. (95$ Conf. Interval) 










26.375 
10.79167 






1.693779 
-9402034 






8.297787 
4.606037 






22.87115 
8.846708 


29.87885 
12.73663 












15.58333 1.383019 6.775382 12.72234 





18.44433 






mean(diff) = mean(postS - pres) t = 11.2676 
Ho: mean(diff) = 0 degrees of freedom = 23 
Ha: mean(diff) < 0 Ha: mean(diff) !- 0 Ha: mean(diff) > 0 
PriT > t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000 


وحيث إننا نتوقع 'تطور" وليس "اختلافا" فقط في متوسطات المتغيرين 
pres‏ و5/ءمص فإن الاختبار الأحادي هو الاختبارالمناسبء احتمال الذيل 
الأيمن المعروض يقترب من الصفر. وهذا يعني أن متوسط إكمال الطلبة 
للعبارات تطوّر بدرجة كبيرة. وبناءً على بيانات المثال؛ فإننا على ثقة بدرجة 
5 بأن مهارات الطلبة في كتابة العبارات الكاملة قد زادت بمعدل ما بين 
7 و18.4 عبارة. 


ea 
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اختبارات y‏ الاعتيادية: تفترض ob‏ المتغيرات تتوزع توزيعا طبيعيا 
حول متوسطاتها. هذه الافتراضية في العادة ليست ذات أهمية بالغةء GY‏ هذه 
الاخقازات تر متوسطة ARM‏ ولكن pac GIS IY‏ الاعتدال: Lad caca‏ 
متطرفة حادة - وهذا يحدث في العينات الصغيرة - فإنه من الأفضل الانتقال 
إلى الوسيط بدلا من المتوسطات» واستخدام اختبار لامعلمي لا يفقرض 
الاعتدال. فعلى سبيل المثال» اختيار ويلكوكسن لرتب الإشارة Wilcoxon‏ 
signed-rank test‏ يفتر ضص أن التوزيع متمائل ومستمر فقطء وتطبيق اختيار 
الرتب على بيانات المثال السابق» سوف يؤدي إلى الحصول على نفس 
النتيجة التي وجدها الأمر cttest‏ وهي أن هناك تطورا Us gale‏ للطلبة في 
إكمال العبارات. وحيث إن الاختبارين وجدا نفس النتيجة؛ فإنه بالإمكان 

إقرار ذلك بثقة أكبر. 
.Signrank 50525 = pres‏ 


Wilcoxon signed-rank test 





sign obs sum ranks expected 











positive 
negative 
zero 





unadjusted variance 1225.00 
adjustment for ties -1.63 
adjustment for zeros 0.00 
adjusted variance 1223.38 


Ho: postS - preS 
2 
Prob > |z| 


4.289 
0.0000 


Two-Sample Tests : احتبارات العيدشين‎ 


بقية هذا الفصل» سوف تشرح > أمثلة من بيانات دراسة استقصائية e‏ 
جمعها من طلبة الجامعة» وقام بالدراسة Ault g Ward‏ في سنة 1990. 


.use "C:\data\student2.dta", clear 
. describe 
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Contains data from C:\data\student2.dta 


obs: 243 Student survey (Ward 1990) 
vars: 18 2 Jul 2012 06:11 

size: 5.346 

storage display value 

variable name type format label variable label 
id int $8.0g Student ID 
year byte 59 . 09 year Year in college 
age byte $8.0g Age at last birthday 
gender byte $9.0g s Gender (male) 
relig byte $8.0g v4 Religious preference 
drink byte $9.0g 33-point drinking scale 
gpa float %9.0g Grade Point Average 
grades byte $8.0g grades Guessed grades this semester 
greek byte $9.0g greek Belong to fraternity or sorority 
live byte $8.0g v10 Where do you live? 
miles byte $8.0g How many miles from campus? 
study byte %8.0g Avg. hours/week studying 
athlete byte $9.0g athlete Are you a varsity athlete? 
employed byte $8.0g employ Are you employed? 
allnight byte $8.0g allnight How often study all night? 
ditch byte $8.0g times How many class/month ditched? 
hsdrink byte $9.0g High school drinking scale 
aggress byte $9.0g Aggressive behavior scale 





Sorted by: year 


نحو %19 من الطلبة ينتمون إلى جمعية الطلبة الذكور أو جمعية الطلبة 
الإناث بالجامعة. في الحرم الجامعي هذه الجمعيات وأعضاؤها يتم الإشارة 
إليهم بأنهم 'يونانيون" ليس بسبب جنسيتهم ولكن لأن أغلب أسماء هذه 

الجمعيات تتألف من حروف يونانية. 
.tabulate greek‏ 


Belong to 
fraternity 






or sorority Freq. Percent Cum. 









non-Greek 


Greek 47 19.34 100.00 


وهناك متغير آخر وهو drink‏ يقيس كم مرة وإلى أي مدى الطلبة 
يتناولون الكحول» والقياس عبارة عن 33 نقطةء الشائعات في الحرم الجامعي 
قد تقود إلى الظن بأن أعضاء الجمعيات الذكور والإناث يميلون للاختلاف 
عن بقية الطلبة في سلوكهم عند تناول الكحول؛ رسم الصندوق يُقارن بين 
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الوسيط لقيم المتغير drink‏ للأعضاء وغير الأعضاءء ورسم أعمدة بيانية 
يُقارن بين المتوسطات. الشكلان يبدو أنهما متفقان على قبول مثل هذه 
الشائعات» الشكل )1.6( يجمع بين الشكلين ويعد اس تخدام الخيار 
ylabel(0(5)25)‏ لجعل قياسات المحور العمودي متناسبة للشكلين معا. 


.graph box drink, over(greek) ylabel(0(5)35) 
saving(fig06 01a) 

.graph bar (mean) drink, over(greek) 
ylabel(0(5)35) saving(fig06 01b) 

graph combine fig06 01a.gph fig06_01b.gph, 
col(2) iscale(1.05) 


3 
35 
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الأمر test‏ الذي تم تطبيقه سابقا على عيفة واحدة واختبارات الاختلاف 
المترابطة يمكن تطبيقها على عينتين. في هذا التطبيق الشكل العام لتركيية 

T‏ هو ttest measurement, by(categorical)‏ فمثلاً: 
.ttest drink, by(greek)‏ 
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Two-sample t test with equal variances 

















Std. Dev. [95$ Conf. Interval] 




















196 17.7602 .4575013 6.405018 16.85792 18.66249 
24.7234 .7124518 4.884323 23.28931 26.1575 


non-Gree 
Greek 











19.935643 





.431224 6.722117 








18.25756 





combined 





-83.928842 -4.997558 





3978608 


diff = meaninon-Gree) - meaniGreek) t = -6.3791 
do: diff = 0 degrees of freedom = 241 

Ha: diff > 0 Ha: diff != 0 Ha: diff » 0 
Pr(T « t) - 0.0000 Pr(|T| > [tj) = 0.0000 Pr(T > t) = 1.0000 


يمكن أن نلاحظ بأن اختبار ۲ يقوم على افتراض تساوي التباين. ولكن 
التباين في عينة الأعضاء الذكور والإناث - في المثال أعلاه - يبدو أنه أقل 
cla diy gh,‏ :هيك agi]‏ يتثنابهون بدرجة كبيزة فى eS gba‏ مغ الظلببة Je‏ 
الأعضاء في الجمعيةء ولإجراء اختبار مشابه بدون افتراض أن التباين 

متساو نقوم بإضافة الخيار unequal‏ كما يلي: 
.ttest drink, by(greek) unequal‏ 


Two-sample t test with unequal variances 






[95$ Conf. Interval] 









17.7602 .4575013 6.405018 16.85792 18.66249 


Greek 47 24.7234 .7124518 4.884323 23.28931 26.1575 


combined 243 19.107 -431224 6.722117 18.25756 19.95643 





diff -6.9632 -8466965 -8.645773 -5.280627 







diff = mean(non-Gree) - mean (Greek) 
Ho: diff = 0 


t = -8.2240 
Satterthwaite's degrees of freedom = 88.22 


Ha: diff < 0 Ha: diff != 0 


Ha: diff > 0 
Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 


Pr(T > t) = 1.0000 


التصحيح لتساوي التباين fa} y‏ النتيجة الأساسية وهي أن Greeks‏ 
(الأعضاء الذكور وآلإناث) non-Greek y‏ (غير الأعضاء) يختلفان بشكل 
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Like) cl ala‏ ققد عه U qa oca sl pasa DUS tja E‏ 
اللامعلمي الذي يُعرف كذلك باسم اختبار مجموع الرتب لويلكوكسن الذي 
يفترض ob‏ ترتيب التوزيعات له نفس شكل المنحنى» اختبار مجموع الرتب 
يشير إلى أننا نستطيع أن نرفض فرضية العدم» وهي أن قيم الوسيط فسي 
المجتمع متساوية. 

.ranksum drink, by(greek) 


Two-sample Wilcoxon rank-sum (Mann-Whitney) test 








expected 








non-Greek | 
Greek 


21111 
8535 








243 





combined 29646 


unadjusted variance 187310.67 


adjustment for ties -472.30 
adjusted variance 186838.36 


Ho: drink(greek==non-Greek) = drink(greek--Greek) 
z = -6.480 
Prob > |z| = 


: (ANOVA) الاجاه الواحد)‎ c5) النباين الأحادي‎ dale 
One-Way Analysis of Variance (ANOVA) 





تحليل التباين (ANOVA)‏ يعتبر طريقة أخرى عامة AS‏ من اختبارات ؛ 
لاختبار الاختلافات بين المتوسطات» أبسط حالات التباين - Qua y‏ التحليل 
الأحادي للتباين - يختبر ما إذا كانت المتوسطات للمتغير ر تختلف بين فئات 
المتغير ×. التباين الأحادي يمكن حسابه عن طزيق استخدام الأمر oneway‏ 
مع الصيغة العامة oneway measurementcategorical‏ فمثلا: 

.oneway drinkgreek, tabulate 
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Belong to 
fraternity 
or sorority 






Summary of 33-point drinking scale 
Mean Std. Dev. Freq. 


















17.760204 
24.723404 


6.4050179 
4.8843233 






non-Greek 
Greek 








19.106996 6.7221166 


Analysis of Variance 


Source SS df MS F Prob > F 
Between groups 1838.08426 1 1838.08426 48.69 0.0000 
Within groups 9097.13385 241 37.7474433 

Total 10935.2181 242 45.1868517 
Bartlett's test for equal variances: chi2(1) = 4.8378  Prob»chi2 - 0.028 


الخيار tabulate‏ يقوم بإنشاء جدول للمتوسطات والانحرافات المعيارية 
بالإضافة إلى جدول تحليل التباين نفسه» تحليل التباين الأحادي مع متغير 
ثنائي x‏ يكافئ اختبار ¢ لعيتتين» وتكون قيمة إحصائية F‏ لهذا الاختبار تساوي 
مربع إحصائية « الأمر oneway‏ يوفر خيارات أكثرء ويعالج البيانات بسرعة 
أكثرء ولكن ينقصه الخيار unequal‏ الذي يساعد فرضية تساوي التباين. 

الأمر toneway‏ يقوم باختبار فرضية تساوي التباين باستخدام اختبار 
بارتليت Bartlett’s X7‏ فعندما تكون احتمالية cub jo‏ منخفضة:» فهذا يعني أن 
فرضية تساوي التباين غير صحيحة. وفي هذه الحالة» يجب عدم الوثوق في 
نتائج اختبار F‏ للتباين. في المثال أعلاه الأمر oneway drink belong‏ احتمالية 
cul jo‏ 0.028 = م» مشيراً إلى وجود شكوك حول صلاحية تحليل التباين 
:-ANOVA‏ 

القيمة الحقيقية لتحليل التباين الأحادي لا تكمن في قدرته على المقارنة 
بين عينتين» بل في قدرته على المقارنة بين ثلاثة متوسطات أو أكثر. فمثلاء 
يمكننا اختبار ما إذا كان متوسط سلوك الطلبة يتفاوت لكل سنة في الكلية. في 
الجدول أدناه كلمة “freshman”‏ شير إلى طلبة السنة الأولى وليس بالضرورة 
أن يكونوا من FSM‏ 

-Oneway drinkyear, tabulate scheffe 
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Year in 
college 











Freshman 
Sophomore 

Junior 
Senior 


18.975 
21.169231 
19.453333 
- 650794 


. 106996 


Summary of 33-point drinking scale 
Mean Std. Dev. Freq. 










. 9226033 
-5444853 65 
. 2866081 75 
. 6409257 





c0 00 










6. 





7221166 


Analysis ọf Variance 


Source SS df MS F Prob » F 
Between groups 666.200518 3 222.066839 5.17 0.0018 
Within groups 10269.0176 239 42.9666008 

Total 10935.2181 242 45.1868517 
Bartlett's test for equal variances: chi2(3) = 0.5103 Prob>chi2 = 0.917 


Comparison of 33-point drinking scale by Year in college 


(Scheffe) 


Sophomor Junior 





Row Mean- 
Col Mean Freshman 
Sophomor 2.19423 
0.429 
Junior 478333 
0.987 
Senior -2.32421 
0.382 


-1.7159 
0.498 


-4.51844 -2.80254 
0.002 0.103 


يمكننا رفض الفرضية القائلة بأن المتوسطات متساوية )0.0018 = (p‏ 
ولكن لا يمكننا رفض فرضية تساي التباين )0.917 = (p‏ النتيجة الثانية تعتبر 


أخبارًا جيدة حول صلاحية “ANOVA‏ 


رسم الصندوق الأفقي (graph hbox)‏ في الشكل )2.6( يدعم هذه 
النتيجةء حيث يعرض تبايناً متشابهاً لكل فئة. وفي الشكل البياني يظهر رسم 
الصندوق مُدمجاً مع رسم بياني لشكل الانتشار (graph dot(mean))‏ يوضح. 
المتوسطات لكل فئة. الرسم البياني الموحد للشكلين يوضح بأن الفروقات بين 
قيم الوسيط (في أعلى (USA‏ والفروقات بين المتوسطات (في أسفل الشكل) 
كلاهما تغيرا بطريقة متشابهة. الرسم البياني لشكل الانتشار يوضح نفس 
النقاط التى يوضحها رسم الأعمدة البيانية» فكلاهما يُستخدمان للمقارنة 
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البصرية بين المنخصات الإحصائية لمتغير واحد أو عدة متغيرات» تركيبة 

الأوامر والخيارات لرسم الأعمدة البيانية والرسم النقطي متشابهان 

فكلاهما يتضمن خيارات الملخصات الإحصائية. لمزيد من التفاصيل قم 
بطباعة الأمر graph dot‏ ماعط. 

.graph hbox drink, over(year) ylabel(0(5)35) 

saving(fig06 02a) l 

-graph dot (mean) drink, over (year) 

ylabel(0(5)35, grid) 

marker(1, msymbol(Sh)) saving(figO6 02b) 


.graph combine fig06 02a.gph fig06 02b.gph, 
row(2) iscale(1.05) 


Freshman 
Sophomore 
Junior 
Senior 





0 5 10 


Freshman 
Sophomore 
Junior 
Senior 





0 5 10 15 20 25 30 35 
mean of drink 


الشكل )2.6( 


الخيار :scheffe‏ (اختبارات المقار نة المتعددة لشافيه (Scheffé‏ مع الأمر 
oneway‏ يقوم بإنشاء جدول يعرض الفروقات بين كل زوج من المتوسطات› 
فمتوسط المتغير freshman‏ يساوي 5 ومتوسط المتغير sophomore‏ 
يساوي 21.6923 13 فسوف يكون عبار $ عن gag freshman-sophomore‏ 
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يساوي 21.6923 - 18.975 = 2.19423 وهو ليس بعيداً عن الصفر 
)0.429 = م)ء وبالنسبة لهذه المقارنات في الجدول أعلاه الفرق الوحيد ذو 
المعنوية هو الفرق بين المتغير senior‏ والمتغير sophomore‏ 16.6508 — 
(p = 0.002) -4.5184 21.1692‏ لذلك فإن النتيجة النهاتية هى أن 
المتوسظات: الأربعة ليت نفسها التي تظهر من fal‏ نات بين الطلبة 
بالسنوات المتقدمة بالجامعة seniors‏ (الذين يشربون بنوع من الاتزان)» وبين 
طلبة السنة الثانية sophomores‏ (الذين يُفرطون في الشرب). 
الأمر coneway‏ يمكنه استخدام خيارات متعددة للمقارنة وهي 
.scheffe, bonferroni, sidak‏ (لمعرفة تعريفات هذه الخيارات انضفر ل 
المستخدم (Base Reference Manual‏ اختبار islas de Scheffé‏ في حالة 
وجود عدد كبير من الشروط بالرغم من أن هذا الاختبار أقل حساسية أحيانا. 
اختبار كروسكال والس :(kwallis)‏ وتعميم عينة K‏ على مجموع رتب 
عينة ثنائية يعتبران من الاختبارات اللامعلميةء وهما بديل لتحليل التباين لعينة 
واحدة. فاختبار كروسكال والس يختبر فرضية العدم القائلة بتساوي قيم 
الوسيط للمجتمع. 
ekwallis drink, by(year)‏ 


Kruskal-Wallis equality-of-populations rank test 


Freshman 4914.00 


Sophomore 9341.50 
Junior 9300.50 
Senior 6090.00 





chi-squared - 14.453 with 3 d.f. 
probability. = 0.0023 

chi-squared with ties = 14.490 with 3 d.f. 
probability = 0.0023 


النتائج أعلاه )0.0023 = (p‏ تتفق مع نتائج ob oneway‏ هناك فروقات 
معنوية في المتغير JS drink‏ سنة في الكلية. وبصفة dale‏ فإن اختبار 
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كروسال والس يعتبر أكثر أمانا من تحليل التباين ANOVA‏ فى حالة وجود 
سبب All‏ : في فرضيات تحليل التباين التي تفقترض بتساوي التباين أو 
الاعتدال أو في حالة وجود مشاكل بسبب القيم المتطرفةء الأمر kwallis‏ يشبه 
الأمر Lel Cos ranksum‏ يعتمدان على فرضية ضعيفةء وهي تمائل شكل 
اارتب في التوزيعات لكل «Ae gene‏ نظريا فإن الأمرين kwallis ; ranksum‏ 
يفترض ان يقوما باستخراج نتائج متشابهة عند تطبيقهما على عينتين 
متشابهتين» ولكن في الواقع فإن هذا يكون صحيحاً فقط إذا كانت البيانات لا 
تحتوي على أي روابط. الأمر ranksum‏ يحتوي على الطريقة الدقيقة للتعامل 
مع الروابط» وهي طريقة مفضلة لمشاكل العينتين. 


: sibl الثباين دي الاجاهين‎ dis 


Two- and N-Way Analysis of Variance 


تحليل التباين ذي الاتجاه الواحد يختبر كيف أن متوسطات المتغير ر 
تختلف خلال Olid‏ متغير واحد آخر وهو ox‏ تحليل التباين المتعدد يقوم بهذا 
التحليل للتعامل مع فئتين أو أكثر من فئات المتغير ox‏ فعلى سبيل المثالء قد 
نحتاج إلى إعادة النظر كيف أن سلوك الطلبة عند تناولهم للكحول يختلمف 
ليس فقط بين الطلبة والطالبات أعضاء الجمعيات» ولكن أيضا الاختلاف فى 
الجنس. وسوف نبدأ باختبار المتوسطات في جدول ثنائي كما يلي: | 


.table greekgender, contents (mean drink) row col 











Belong to 
fraternit 
y or 

sorority 


Gender (male) 
Female Male Total 










non-Greek 
Greek 


16.51724 19.5625 17.7602 
22.44444 26.13793 24.7234 


Total 17.31343 21.31193 19.107 


: l 
للكحول من الإناث؛‎ Ysa jj su OU نتائج هذه العينة» توضح‎ 
وأعضاء کا الطلبة من الذكور والإناث أكثر تناو لا للكحول من غير‎ 
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الأعضاء في هذه الجمعيات. الفرق بين Greek/non-Greek‏ يبدو le jui‏ بين 
الذكور والإناث. 

الأمر canova‏ والذي يمكن استخدامه لتحليل التباين المتعدد. يمكنه 
اختبار الفروقات المعنوية للأعضاء والجنس (سوف تتم كتابته على هذا 
الشكل -(greekitgender‏ 


.anova drink greek gender greek#gender 






Number of obs - 243 R-squared = 0.2221 
Root MSE = 5.96592 Adj R-squared = 0.2123 
Source 


Partial SS df MS F Prob > F 











Model 2428.67237 3 809.557456 22.75 0.0000 
greek 1406.2366 1 1406.2366 39.51 0.0000 
gender 408.520097 1 408.520097 11.48 0.0008 
greek#gender 3.78016612 1 3.78016612 0.11 0.7448 


Residual 8506.54574 239 35.5922416 





Total 10935.2181 242 45.1868517 


في هذا المثالء نتائج تحليل التباين ذي الاتجاهين توضح gh‏ هناك 
تأثيرات أساسية ذات معنوية لأعضاء الجمعية )0.0000 = greek(p‏ والجنس 
gender(p = 0.0008)‏ ولكن تفاعلهما يساهم بدرجة قليلة في النموذج (p^‏ 
(0.7448 لأن هذا التفاعل لا يمكن تمييزه عن الصفرء وقد نشير إلى أنه 
يُناسب نموذج huf‏ بدون مصطلح التفاعل. 

لإضافة أي مصطلح تفاعل مع الأمر anova‏ 3333 أسماء المتغيرات 
وربطها مع بعضها بالرمز # (أو ## للتفاعل العاملي). إذا لم يكن عدد 
المشاهدات لكل مجموعة في قيم المتغير × هي نفسهاء فإن (هذا الشرط يُطلق 
عليه البيانات المتوازنة) فقد يكون من الصعب تفسير التأثيرات الرئيسة في 
نموؤذج ما يتضمن تفاعلات. هذا لا يعني أن التأثيرات الرئيسة في مثل هذه 
النماذج ليست مهمة. تحليل الانحدار قد يساعد في تفسير نتائج تحليل التباين 
المعقدة كما سوف نرى لاحقا في الجزء التالي. 
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: (ANCOVA) اطتغيرات العاملية وتحليل التغاير‎ 
Factor Variables and Analysis of Covariance (ANCOVA) 





الأمر canova‏ والعديد من أوامر التقدير ببرنامج ستاتاء تسمح بتحديد 
المتغيرات المستقلة وكتابتها في متغير عاملي. فقبل كتابة اسم متغير مستقل 
نضع قبله الرمز ii‏ والذي يحدد لبرنامج ستاتا أن هذا المتغير يتضمن متغيرًا 
تنبؤيا (Gili)‏ لمستويات متغير تصنيفي» GY‏ كل تصنيف له تفرعاته الثنائيةء 
المتغيرات التصنيفية والتي يسبقها الرمز .ة يجب أن تحتوي على أعداد 
صحيحة موجبة من 0 إلى 32,740 والأمر anova‏ سوف يقوم بشكل 
افتراضي باعتبار JS‏ المتغيرات المستقلة متغيرات تصنيفية. لذا قم بطباعة 
الأمر التالي: 

‘anova drink greek year greek#year 

كما يمكن تنفيذ نفس النموذج بطباعة الأمر: 
“anova drink i.greek i.year i.greek#i.year‏ 


Number of obs - 243 R-squared - 0.2265 
Root MSE = 5,99962 Adj R-squared - 







Source Partial SS af MS F Prob » F 










Model 2476.29537 7 353.756482 9.83 0.0000 


greek 1457.93596 1 1457.46 40.50 0.0000 
year 217.492051 3 72.4973502 2.01 0.1127 
greek#year 148.508479 3 49.5028264 1.38 0.2510 


Residual 8458 .92273 235 35.9954159 





Total 10935.2181 242 45.1868517 


وكما هي العادة مع تحليل التباين ANOVA‏ يمكننا الحصول على نظرة 
مباشرة للنموذج الضمنيء وذلك بإعادة شرح التحليل على أنه تحليل انحدارء 
وبرنامج ستاتا يقوم بذلك بسهولة» فقط قم بطباعة الأمر regress‏ مباشرة بعد 
أمر 28 بدو ن إضافة أي متغيرات. 


-regress 
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Source SS df MS Number of obs - 243 

- F( 7, 235) = 9.83 

Model 2476.29537 7 353.756482 Prob > F = 0.0000 
Residual 8458.92273 235 35.9954159 R-squared = 0.2265 
Adj R-squared = 0.2034 

Total 10935.2181 242 45.1868517 Root MSE = 5.9996 














Std. Err. [95% Conf. Interval) 








3.162076 14.03519 













7.805556 





1.575917 





l.greek 


year 
2 1.138889 1.322791 0.86 0.390 -1.467156 3.744934 
3 .3648776 1.268844 0.29 0.774 -2.134884 2.864639 
4 -3.043501 1.295774 -2.35 0.020 -5.596319 -.4906827 
greek#year 
12 -.7859477 . 3.586922 -0.22 0.827 -7.852579 6.280683 
13 -3.614878 ` 3.58588 -1.01 0.314 -10.67945 3.4497 
14 1.643501 3.778548 0.43 0.664 -5.800655 9.087657 
_cons 18.19444 . 9999363 18.20 0.000 16.22446 20.16443 





لاحظ Gl‏ مجاميع مربعات اختبار R's F‏ وتفاصيل أخرى متطابقة 
لمكافئ تحليلات الأمر | g anova‏ الأمر LS cregress‏ أن جدول regress‏ يوفر 
تفاصيل أكثر من canova yl‏ ويمكننا مشاهدة كل قيمة من قيم المتغير year‏ 
حيث تم معاملة هذا المتغير كمؤشر للتنبؤء حيث إننا نرى بأن طلبة السنة 
الأولى من فئة مختلطة في هذا الجدول. 

لذا فإن المُعَاملات في السنة الثانية والثالثة والرابعة تظهر عكس مُعَامل 
السنة الأولى؛ ففي السنة الثانية الطلبة غير الأعضاء non-Greek‏ كان معدل 
تناولهم المشروبات الكحولية أكثر من )1.14+( في حين أن هذا المعدل كان 
منخفضاً las‏ في السنة الرابعة (3.04-) مقارنة بطلبة السنة الأولىء 
مُعاملات متغير السنة year‏ متعلقة بمُعاملات لمتغيرات وهمية تم ترميزها 
بالرقم 1 لسنة معينة و0 لأي سنة «qs jl‏ معاملات المتغير greek‏ متعلقة 
بمعامل متغير وهمي تم ترميزها بإعطاء رقم 1 للأعضاء Greek‏ و0 لغير 
الأعضاء .non-Greek‏ 
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bul حص ء مع امسا‎ NERO n LEE E EE 


تحليل التغاير (ANCOVA)‏ يمند لعدد N‏ طريقة لتحليل التباين ANOVA‏ 
ليشمل خليطا من متغيرات × التصنيفية والمتصلة المحدد .» والذي يسبق 
عدا من الأوامرء يقوم بتحديد متغير مستقل معين كمتغير مستمرء وتتم 
معاملة قيمه كقياسات بدلا من معاملتها كقيم مستقلة» وتكون تحت فئثات 
معينة» قد يمكننا معاملة متغير year‏ كمتغير متصل. 


.anova drink i.greek c.year i.greeklic.year 










Number of obs - 243 R-squared = 0.1965 
Root MSE = 6.06334 Adj R-squared = 0.1864 
Source Partial SS df MS F Prob > F 


Model 2148.60352 3 716.201174 19.48 0.0000 
greek 186.474269 1 186.474269 5.07 0.0252 

year 147.628787 1 147.628787 4.02 0.0462 
greek#year . 203073456 1 .203073456 0.01 0.9408 


Residual 







8786.61458 239 36.7640778 





Total 10935.2181 242 45.1868517 


-regress 







Source 



















Number of obs = 243 

F( 3, 239) = 19.48 

Model 2148.60352 716.201174 Prob > F = 0.0000 
Residual 98786.61458 239 36.7640778 R-squared = 0.1965 
< Adj R-squared = 0.1864 

Total 10935.2181 242 45.1868517 Root MSE = 6.0633 








Std. Err. 


(95$ Conf. Interval] 














l.greek 6.776657 3.00897 2.25 0.025 .8491681 12.70415 
year -1.103421 .4068558 -2.71 0.007 -1.904902 -.3019392 
greeké&c.year 
1 .0789217 1.061895 0.07 0.941 -2.012947 2.17079 
_cons 


20.69328 1.164985 17.76 0.000 18.39833 22.986823 


الشكل الجديد للنتائج 5 معاملة السنة year‏ كمتغير متصل (c.year)‏ بدلا 
من متغير تصنيفي (year)‏ يجعل النموذج أكثر بساطة مع درجات حرية 
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أعلى» ولكن ۸ المعدلة توضح Gh‏ هذه النسخة من النتائج غير متناسبة 
)0.1864 مقابل 0.2034(« الإصدار التصنيفي للنتائج يوضح بأن معدل 
تناول الشراب مرتفع في السنة الثانية )1.14+( مقارنة مع السنة الأولىء 
ومرتفع قليلا في السنة الثالثة )0.36+( مقارنة بالسنة الأولىء ولكنه أقل 
بكثير في السنة الرابعة )73.04( مقارنة بالسنة الأولى. النتائج التي تم 
استخراجها Sly‏ على المتغيرات المتصلة كشفت ارتفاع وانخفاض بسيط 
بمتوسط انخفاض بلغ 1.10- في السنة. 
معاملة متغير year‏ كمتغير تصنيفي أو متصل يرجع للمحلل نفسه بناءً 
على أسباب إحصائية أو Ase gua ge‏ المتغيرات الأخرى مثل تقدير الطالب 
(gpa)‏ فهي بوضوح متغيرات متصلةء فعندما نقوم بإدخال المتغير gpa‏ ضمن 
المتغيرات المستقلة» فإننا نجد أنه أيضا مرتبط بسلوك الطلبة فى تناول 
الكحول. هذا النموذج يمزج التأثيرات التفاعلية والتي لم يتم إثبات بأنها ذات 
معنوية» GY‏ المتغيرات التصنيفية هي الوضع الافتراضي بالنسبة للأمر 
Ul canova‏ الخيار الذي يسبق المتغير وهو .1 فيمكن إدخاله مع المتغير greek‏ 
او متغير gender‏ 
.anova drink greek gender © . 3‏ 


Number of obs 
Root MSE 


218 R-squared 
5.68939 Adj R-squared 


wo 
o 
N 
© 
m 
N 







Source Partial SS df MS F Prob > F 









Model 2927.03087 3 975.676958 30.14 0.0000 


greek 1489.31999 1 1489.31999 46.01 0.0000 
gender 405.137843 1 405.137843 12.52 0.0005 
gpa 407.0089 1 407.0089 12.57 0.0005 


Residual 6926.99206 214 32.3691218 





9854.02294 217 45.4102439 


من هذا التحليل» يمكننا معرفة وجود علاقة ذات معنوية بين سلوك 
الطلبة في تناول الكحول drink‏ وتقدير الطالب gpa‏ وذلك عند استخدام 
المتغير greek‏ و المتغير gender‏ كمتغيرات ضابطة؛ ويجب ملاحظة أن 
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ترابط المتغيرات» ويُعتبر تحليل الانحدار أفضل من غيره للقيام بذلك. 


.regress 




























Source Number of obs - 218 
F( 3, 214) - 30.14 

Model 2927.03087 3 975.676958 Prob > F = 0.0000 
Residual 6926.99206 214 32.3691218 R-squared = 0.2970 
Adj R-squared = 0.2872 

9854.02294 217 45.4102439 Root MSE = 5.6894 


















Coef. ` Std. Err. (95% Conf. Interval] 










6.547869 . 9653204 4.645116 8.450623 
1.gender 2.808418 . 7938269 3.54 0.000 1.243697 4.373139 
gpa -3.038966 .8570168 -3.55 0.000 -4.728241 -1.34969 


24.72871 2.539529 19.72301 





29.7344 






القيم اطتوقعة والرسم البياني لأعمدة الخطا : 


Predicted Values and Error-Bar Charts 





الأمر anova‏ يليه الأمر predict‏ الذي يقوم بحساب القيم المتوقعة 
والبواقي أو الأخطأ المعيارية والإحصائية التشخيصية. أحد استخدامات مثل 
هذه الإحصائيات هو رسم بياني يمثل نتائج النموذج» مثل الرسم البياني 
لأعمدة الخطأ. لشرح ذلك سوف نعود إلى تحليل التباين ذي الاتجاه الواحد 


year ومتغير‎ drink لمتغير‎ 
.anova drink year 


Number of obs - 243 









R-squared = 0.0609 
Root MSE = 6.55489 Adj R-squared = 0.0491 
Source Partial ss df MS F Prob > F 





Model 666.200518 3 222.066839 5.17 


year 666.200518 3 222.066839 ° 5.17 


Residual | 10269.0176 239 42.9666008 =g 





10935.2181 242 45.1868517 
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لكات Ani ial Coal‏ من لحرن ول نوه تق SANE tips‏ 
Gus predict newvarl‏ إن "newvarl?‏ يمكن أن يكون أي اسم متغير تريد 
معرفة متوسطاته المتوقعةء أما الأمر predict newvar2,stdp‏ يقوم بإنشاء 
متغير ثان جديد يحتوي على الأخطاء المعيارية للمتوسطات المتوقعة. 


.predict drinkmean 
.predict SEdrink, stdp 


با ستخدام المتغيرين الجديدين وهما المتغير drinkmean‏ و المتغير SEdrink‏ 
يمكننا حساب 5 تقريبا من فترات الثقة» وهي عبارة ع ن المتوسطات 
زائدا أو ناقصا 2 الأخطاء المعياريةء الرسم البياني لأعمدة الخطأ في الشكل 
)3.6( تحتوي على رسم بياني في أعلاه رؤوس مدببة (reap)‏ لأعمدة الخطأء 
وتم تركيب رسم بياني آخر فوقه لخط متصل (connect)‏ للمتوسطات. 

.gen drinkhi - drinkmean + 2 * SEdrink 

.gen drinklo = drinkmean - 2 * SEdrink 

.graph twoway rcap drinkhi drinklo year, 

color (maroon) 

|| connect drinkmean year, lwidth(medthick) 
color (maroon) 

|| , y1labeli(14(1)23, grid gmin gmax) 
ytitle("Drinking scale") 


legend(off) text(18 2 "Mean "zchar(177)'2SE", 
box margin(small)) 





e 
N 
N 
N 
- 
N 
eo 
N 
2 
ge 
c 
€ 
É 2 Mean = z2SE 
= 
a 


17 


15 


14 





Year in college 


الشكل )3.6( 
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الشكل )3.6( يحتوي على عدد من الخيارات الأخرى لجعل الشكل أكثر 
وض وحاء فالخيار أن a—i connect 5 reap‏ إعطاؤهما نفس اللون 
«color(maroon)‏ ومربع شرح الرسم تم إيقافه عن طريق كتابة الخيار 
(legend(off))‏ وذلك في مقابل مربع نصّي صغير لتوضيح أن الرسم البياني 
يعرض “Mean £2SE"‏ وعلامة الزائد أو الناقص + عبارة عن الرمز 177 
في ASCII‏ والتي تم تمثيلها في الأمر بواسطة '-char(177)‏ الشكل )16.3( 
في Jail‏ )3( يعرض مجموعة كاملة من رموز ASCI‏ المتوافرة للاستخدام 
في الرسومات البيانية ببرنامج ستاتا. 

الشكل )3.6( بهذه الطريقة يزودنا بمقدمة predict OU‏ والذي له العديد 
من التطبيقات في النماذج الإحصائية» وهناك طريقة أخرى لرسم أعمدة 
الخطأ وذلك عن طريق استخدام الأمر margins‏ والأمر Cus «marginsplot‏ 
يقوم الأمر margins‏ بحساب المتوسطات الحدية أو المتوسطات المتوقعة بعد 
أمر النموذج الإحصائيء Lil‏ الأمر marginsplot‏ فيقوم بعرض بياني لكل هذه 
الحسابات. ففي المثال أدناه الأمر margins year‏ يقوم بحساب قيم المتوسط 
للمتغير drink‏ لكل Ai‏ ثم يقوم الأمر marginsplot‏ بإنشاء رسم بياني مع 
فترة الثقة الخاصة cay‏ الشكل )4.6( عبارة عن شكل واضح ولكن ليس 
بالإمكان تطبيق العديد من خيار ات الأمر twoway‏ على الأمر -marginsplot‏ 


margins year 
-marginsplot 


Adjusted Predictions of year with level(95)% Cls 


22 


Linear Prediction 
18 


16 


Freshman Sophomore Junior 
Year in college 


الشكل )4.6( 


Senior 
Pd 
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بالنسبة لاختبار التباين العاملي ذي الاتجاهين» فإن أعمدة الخطأ تساعدنا 
في معاينة التأثيرات التفاعلية والرئيسة. ففي المثال أعلاهء قمنا باس تخدام 
مقياس للسلوك العدواني ئ وتم اعتباره lys‏ ا ٠‏ في تحليل التباين 
العاملي كل من المتغير year‏ والمتغير gender‏ وشرط التفاعل genderüyear‏ 
جميعها تعتبر مؤشرات تنبؤء وفي ضوء العلاقة غير الخطية» فإن تأثيرات 
المتغير year‏ يمكن مشاهدتها في الشكل )6 .3( والشكل (4.6) لهذا التحليل. 
dad WS‏ التعامل الافتراضي year all‏ وهي معاماته pists BLS‏ 
ize potias Ae] PER‏ كما أن اختبارات F‏ توضح بأن متغير 
gender‏ ومتغير year‏ وشرط التفاعل gendertyear‏ جميعها لها تأثيرات 


معنوية. 
.anova 3002© 55 gender year gender#tyear‏ 
Number of obs = 243 R-squared = 0.2503‏ 
Root MSE = 1.45652 Adj R-squared = 0.2280‏ 







Source Partial ss 





23.7832147 











Model 166.482503 


gender 94.3505972 1 94.3505972 44.47 0.0000 
year 19.0404045 3 9 29 0.0317 
gender#year 24.1029759 3 8.03432529 3.79 0.0111 


Residual 498.538073 2.12143861 





665.020576 2.74801891 


قمنا باستخدام الأمر predict‏ لحساب متغير جديد يحتوي على 
المتوسطات المتوقعةء واستخدمنا predict, stdp‏ لحساب الأخطاء المعيارية» 
الحدود العليا والدنيا لفترة الثقة تساوي تقريباً زائد أو ناقص 2 الأخطااء 
المعيارية. لتمثيل شرط التفاعل genderilyear‏ بيانيا سوف ستخدم الأمفر 
graph‏ لإنشاء الشكل )5.6( مع الخيار by(gender)‏ لرسم أشكل بيانية 
منفصلة tid‏ الذكوز والإنات:. يعطن ol Jui‏ الأخرائ تقوم Satta‏ فتن 
التفاصيل الثانوية الأخرى مثل العلامات بالرسم البياني (علامات ماسيّة 
2S Diamonds‏ 6( وإيقاف ظهور كل من مربع شرح الرسم البياني «legend‏ 
ومربع الملاحظات emote‏ ويمكتنا Lal‏ رسم مربعاتة صغيرة بخلفية بيضناء 
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حول نص “Meant2SE”‏ والتي يجب وضعها بعناية في داخل الرسم» بحيث 
لا تغطي أي بيانات داخل الرسم نفسه. 


.predict aggmean 
.predict SEagg, stdp 

.gen agghi - aggmean + 2 * SEagg 

.gen agglo = aggmean - 2 * SEagg 

.graph twoway rcap agghi agglo year 

| | connect aggmean year, lwidth(medthick) 
msymbol (D) 

|| , by(gender, legend(off) note("") ) 
ytitle("Aggressive behavior scale") 
text(1.7 2 "Mean "-char(177)'2SE", box 
margin(small) bfcolor(white)) 


Female Male 


ك 
à‏ 
N‏ 9 
Meant2SE‏ $ 
: 
i -‏ 
2 

o 

4 2 3 4 gf Mc 


Year in college 
(5.6) الشكل‎ 


يمكن إنشاء رسم بياني آخر لأعمدة الخطأ بطريقة أسرع باستخدام الأمر 
margins‏ والأمر -marginsplot‏ الأمر margins gender#year‏ يحسب القيم 
المتوقعة أو المتوسطات للمتغير drink‏ موضحا في الرسم ذاته الجنس 
gender‏ و السنة ear‏ ثم يقوم الأمر marginsplot, by(gender)‏ بإنشاء الرسم 

البياني لهذه المتوسطات مع فترات الثقة لكل جنس (الشكل 6.6). 
margins gendertdyear 0‏ 
marginsplot, by (gender)‏ 
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Adjusted Predictions of gender#year with level(95)% Cls 


Female Male 
e 
c 
Sn 
2 
D 
2 
a 
5 
o 
& 
د ات‎ 
o 
La ل‎ E eT © 
Freshman Sophomore Junior Sefkeshman Sophomore Junior Senior 
Year in college 
)6.6( الشكل‎ 


الشكل )5.6( والشكل )6.6( glina‏ تفاصيل حول الجنس» والتأثيرات 
التفاعلية والتي تم حسابها بواسطة الأمر anova‏ فمتوسطات الإناث في 
مقياس السلوك العدواني» شهدت بعض التقلبات مقارنة بمستوياتها المنخفضة 
خلال السنوات الأربع في الكليةء أما متوسطات الذكور فكانت أعلى خلال 
الفترة مع بلوغها أقصى مستوى لها في السنة الثانية مشابهة للنمط الذي 
رأيناه سابقا لسلوك الطلبة في تناول الكحول (الشكل 2.6 والشكل 3.6). لذا 
فإن العلاقة بين المتغير aggress‏ الذي يمثل مقياساً للسلوك العدواني؛ ومتغير 
السنة year‏ تختلف من الذكور للإناث. الرسومات البيانية لأعمدة الخط' هي 
عبارة عن تكملة مرئية لجداول anova ye!‏ والأمر cregress‏ فالرسومات 
البيانية تم إنشاؤها بناءَ على بيانات تلك c das‏ بينما الجداول تؤكد على أن 
التأثيرات ذات معنوية. وهذه الجداول تعرض تفاصيل رقميةء إلا أن استخدام 
الرسومات البيانية يساعد في فهم معني هذه التأثيرات. 


تحليل الانخدار الخطي 


Linear Regression Analysis 











'ستاتا" يوفر عدذا كبيرًا من طرق تحليل الانحدار. يمدنك قراءة قائمة 
جزئية بالطرق المحتملة عن طريق طباعة الأمر regress.‏ م1: ط. هذا Jail‏ 
الصغرى العادية (OLS)‏ والتي يمكن القيام بها باستخدام > «regress‏ 
والأوامر الأخرى المتعلقة بهذا الأمر. الطرق التشخيصية والبيانية التي تأتي 
بعد تحليل الانحدار» عبارة عن امتداد لأدوات تحليل الانحدار وتساعد فى 
تفسير النتائج» كما أنها تكشف وتتعامل مع الأمور المعقدة في التحليل. الأمر 
regress‏ باستطاعته القيام ببعض التحليلات الأخرى غير تحليل المربعات 
الصغرىء وهذه التحليلات ند y‏ تتضمن المربعات الصغرى المرجحة. . وسوف يتم 
شرح طرق التحليل الانحدار الأخرى في الفصل (8) والفصول اللاحقة له. 
القوائم التالية تمكنك من الوصول للعمليات المطلوبة لتحليل الانحدار. 
Statistics < Linear models and related < Linear regression‏ 
Statistics < Linear models and related < Regression diagnostics‏ 
Graphics » Twoway graph (scatter, line, etc.)‏ 
Statistics > Postestimation > Predictions, residuals, etc.‏ 
Statistics > Postestimation > Marginal means and predictive‏ 
margins‏ 
Statistics > Postestimation > Margins plots and profile plots‏ 


هذا الفصل› يوضح بعض طرق إنشاء الرسومات البيانتية لنماذج 


الانحدار» ويمكنك أن تجد العديد من الأمثلة في مقال Interpreting and‏ 
Visualizing Regression Models Using Stata (Mitchell 2012).‏ 
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أمثلة عن الأوامر : Example Commands‏ 


.regress y x 
يقوم هذا الأمر بحساب الانحدار بطريقة المربعات الصغرى العادية‎ 
.× على متغير تنبؤي‎ y للمتغير‎ (OLS) 


.regress y x if ethnic -- 3 & income » 50 & 
income « . 


Ep: y elu ca ue s Lait ce SI) xag 
أكبر من 50 (وليست هناك قيم‎ income يساوي 3 والمتغیر‎ ethnic المتغير‎ 
مفقودة).‎ 
.predict yhat 
وهو يساوي القيم‎ (phat باسم‎ Lil pte إنشاء متغير جديد (تم تسميته‎ 
المتوقعة من أحدث تحليل للانحدار.‎ 
-predict e, resid 
وهو يساوي بواقي أحدث‎ (e باسم‎ Lilja إنشاء متغير جديد (تم تسميته‎ 
: تحليل للانحدار.‎ 
.predict new, cooksd 
كيف أن‎ Lass Cook's Distance إنشاء متغير جديد يساوي مسافة كوك‎ 
كل مشاهدة تؤثر في النموذج المقترح.‎ 
-predict new, covratio 
Belsley, Kuh and إنشاء متغير جديد يساوي إحصائية بلسلي وكو وولسك‎ 
على مصفوفة‎ ith وهذه الإحصائية تقيس تأثير الحالة‎ «Welsch COVRATIO) 
التباين - التة اير للمعاملات المقذرة.‎ 
.predict DFx1, dfbeta (x1) 
التي تقيس كيف أن كل مشاهدة تؤثر‎ DFBETAS حالة‎ Alas] إنشاء‎ 
DFBETAS عة متكاملة ل‎ gana ولإنشاء‎ ax]. على معاملات المتغير التنبؤي‎ 
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لكل المتغيرات التنبؤية في النموذج قم بطباعة الأمر dfbeta‏ بدون إضافة أي 


. > 


شيء اخر. 
-predict new, dfits‏ 
يقوم بإنشاء إحصائيات 28775 التي تلخص تأثير كل مشاهدة على 
النموذج المقترح (هو نفس الهدف الذي تسعى إليه مسافة كوك وإحصائية 
ويلسك). 
.graph twoway lfit y x || scatter y x‏ 
يقوم بإنشاء رسم بياني موضحاً خط الانحدار البسيط ine)‏ أو خط 
التطابق) مع شكل الانتشار للمتغير رمع المتغير ×. 
.graph twoway mspline yhat x || scatter y x‏ 
يقوم بإنشاء رسم بياني موضحا خط الانحدار البسيط مع شكل انتشار 
للمتغير برمع المتغير x‏ وذلك بواسطة خط واصل (مع مكعبات منتشرة تحت 
المنحنى) بين القيم المتوقعة للانحدار (في هذا المثال تم تسميتها «(yhat‏ 
وهناك العديد من الطرق البديلة لرسم خطوط الانحدار وهذه الطرق تتضمن 
mspline, mband, line, Ifit, Ifitci, qfit, qfitci, marginsplot‏ و كل b‏ يقة لها 
ميزاتها وخياراتها. 
.graph twoway scatter e yhat, yline(0)‏ 
يقوم برسم بياني للبواقي والقيم المتوقعة باستخدام المتغيرات yhat s e‏ 
كما يمكن إنشاء نفس الرسم بطباعة الأمر rvfplot‏ (البواقي) بعد تحليل 
الانحدار الناتج وإنشاء الرسم البياني. 
.regress y x1 x2 x3‏ 
يقوم بحساب الانحدار المتعدد للمتغير ر مع ثلاثة متغيرات تنبؤية هي 
x1, x2, x3‏ 
.test x1 x2‏ 
يقوم بحساب اختبار ۶ لفرضية العدم التي تفترض أن المعامل 1× 
والمعامل x2‏ مساويان للصفر في آخر نموذج الانحدر. 


-regress y x1 x2 x3, vce(robust) 
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يقوم بحساب الثقة (هيوبر/ (Huber/White) (<ul,‏ التي e LL la I gere‏ 
المعيارية» انظر دليل المستخدم User's Guide‏ لمزيد من التفاصيلء الخيار 
vee(robust)‏ يعمل كذلك مع العديد من الأوامر الأخرى الملائمة للنموذج. 
.regress y x1 x2 x3, beta‏ 
يقوم هذا الأمر بحساب الانحدار المتعددء ويقوم بتضمين مُعَاملات 
الانحدار المعياري (أوزان بيتا) في جدول المخرجات. l‏ 
.correlate x1 x2 x3 y‏ 
يقوم بإنشاء مصفوفة ارتباطات بيرسون Lassie‏ المشاهدات التي لا توجد 
بها قيم مفقودة في كل المتغيرات التي تم إدراجها في الأمرء عند إضافة الخيار 
covariance‏ فسوف يتم إنشاء مصفوفة التغاير - التباين بدلاً من الارتباط. 
-pwcorr X1 x2 x3 y, sig star(.05)‏ 
N‏ بإنشاء مصفوفة ارتباطات بيرسون مستخدما الحذف الثنائي للقيم 
المفقودة ويعرض احتمالات اختبار ۲ لفرضية العدم 0 = :]8 لكل ارتباطء 
الارتباطات ذات معنوية إحصائية (في هذا المثال 0.05 >م) سوف يتم الإشارة 
ليها بعلامة النجمة (*). 
-graph matrix x1 x2 x3 y, half‏ 
يقوم برسم مصفوفة الانتشارء وحيث إن المتغيرات المدرجة هي نفسها التي 
تم استخدامها في الأمر السابق» فهذا المثال يقوم بإنشاء شكل الانتشار ويجعله 
منظماً بالطريقة التي قام بها الأمر pweorr‏ عند إنشاء مصفوفة الارتباطء وعند 
إدراج المتغير المستقل y)‏ في آخر الأمرء فإن هذا يعني إنشاء مصفوفة فيها 
الصف السفلي عبارة عن سلسلة لنقاط المتغير as y‏ نقاط المتغير x‏ 
«estat hottest‏ 
يقوم هذا الأمر بحساب اختبار كوك وويسبرج Cook and Weisberg's test‏ 
لاختلاف التباين theteroskedasticity‏ وإذا كان لدينا سبب للشك ob‏ اختلاف 
التباين هو دالة لمتغير تنبؤي معين x]‏ فيمكننا التركيز على ذلك المتغير 
التنبؤوي» وذلك بطباعة الأمر 1× cestat hettest‏ وللحصول على قائمة كاملة 
بالخيارات المتوافرة مع regress ` yaY!‏ قم بطباعة الأمر help regress‏ 
as 35 postestimation‏ اختيارات مختلفة للتقدير البعدي للنماذج. 
-estat ovtest, rhs‏ 
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يقوم بحساب اختبار خطأ محدد انحدار رمزي Ramsey regression‏ 
specification error test‏ للمتغيرات Alagall‏ الخيار rhs‏ يتطلب استخدام قوى 
متغيرات الطرف الأيمن للمعادلة بدلا من القوى المتوقعة للمتغير ر (وهو 
الخيار الافتراضي). 
.estat vif‏ 
E es‏ ك افق ase. ere‏ الخ 
-multicollinearity‏ 
.estat dwatson‏ 
يقوم بحساب اختبار دوربن واتسون Durbin-Watson‏ للارتباط الذاتي من 
الدرجة الأولى في السلاسل الزمنية لبيانات Jail (tsset)‏ )12( يوضح 
All‏ عن هذا الاختبار وبعض الإجراءات الأخرى في السلاسل الزمنية. 
.acprplot x1, mspline msopts (bands (7) )‏ 
يقوم بإنشاء رسم بياني للمكونات المدمجة EF‏ البواقي cà jx)‏ اا 
باسم الرسم البياني للبواقي .الجزتية المدمجة) في العادة أفضل من الأمر 
cprplot‏ في فحص exc‏ الخطيّة سسا الخيار mspline‏ 
msopts(bands(7))‏ يقوم بإنشاء خط متصل للربط بين قيم الوسيط في سبع 
نطاقات عمودية» أو Ya‏ عن ذلك يمكننا إنشاء منحنى خفيف منخفض بعرض 
5 وذلك من خلال الخيارات -lowess lsopts(bwidth(.5))‏ 
.avplot x1‏ 
يقوم بإنشاء رسم بياني لمتغير إضافي (يطلق عليه Laf‏ اسم انحدار 
جزئي أو شكل التأثير) يعرض العلاقة بين المتغير y‏ والمتغير 1× وكلاهما 
تم ترجيحهما للمتغيرات الأخرى ox‏ مثل هذه الأشكال تساعد على معرفة القيم 
المتطرفة ونقاط التأثير. 
.avplots‏ 
يقوم بإنشاء رسم بياني يتضمن صورة وأحدة لكل الرسومات البيانية 
للمتغيرات المضافة أخيراً من الأمر anova‏ أو الأمر „regress‏ 
.Cprplot x1‏ 
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يقوم بإنشاء رسم بياني للمكون زائدا الباقي (يُعرف La‏ باسم الرسم 
البياني للبواقي الجزئية) يعرض العلاقة المعدلة بين المتغير بر والمتغير 
التنبؤي ox]‏ ومثل هذه الأشكال تساعد في التعرف على العلاقات غير الخطيّة 


في البيانات. 
.lvr2plot‏ 
يقوم بإنشاء رسم بياني للتأثير مع تربيع البواقي (يُعرف paul, Leal‏ 
شكل (L-R‏ 
.rvfplot‏ 


يقوم برسم البواقي مع القيم المتوافقة (المتوقعة) للمتغير Jy‏ 
.rvpplot x1‏ 
يقوم برسم البواقي مع قيم المتغير التنبؤي /<. 
y x1 x2 i.catvar i.catvartc.x2‏ 2692688 . 
يقوم بحساب انحدار المتغير بر على المتغيرات التنبؤية x2‏ .1× 
ومجموعة من المتغيرات الوهمية التي يتم إنشاؤها بشكل تلقائي Cad‏ فئات 
المتغير catvar‏ ومجموعة من شروط التفاعل التي تساوي المتغيرات الوهمية 
مضروبة في قياس (مستمر) المتغير x2‏ للخصول على معلومات أكثر عن 
هذا الأمر قم بطباعة الأمر fvvarlist‏ ماعط. 
-Stepwise, pr(.05): regress y x1 x2 x3‏ 
يقوم بحساب الانحدار المتدرج مستخدماً التقريب حتى تصبح جميع 
المتغيرات التنبؤية المتبقية ذات معنوية عند مستوى 0.05. كل المتغيرات 
التنبؤية المدرجة يتم إدخالها في أول تكرارء لذا فكل تكرار يقوم بحذف 
متغير تنبؤي واحد له أعلى مستوى ثقة م حتى تصبح احتمالات كل 
المتغيرات التنبؤية المتبقية أقل من احتمال الإبقاء عليه (05.):م» هناك عدة 
خيارات تسمح بالتقدم أو الاختيار الهرمي» الأمر stepwise‏ يعمل العديد من 
أوامر النماذج الإحصائية الأخرى» وللحصول على قائمة بهذه الخيارات قم 
بطباعة الأمر -help stepwise‏ . 
.regress y x1 x2 x3 [aweight - w]‏ 


-— 
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يقوم بحساب انحدار Gly yall‏ الصغرى المرجحة (WLS)‏ للمتغير y‏ 
على المتغيرات cx, x2, x3‏ المتغير 1 يقوم بالاحتفاظ بالأوزان التحليليةء 
والقيام بهذا أشبه بقيامنا بضرب كل متغيرء وكل cu‏ في الجذر التربيعمي 
للمتغير « ثم حساب الانحدار. الأوزان التحليلية في العادة يتم اس تخدامها 
لتصحيح اختلاف التباين heteroskedasticity‏ عندما يكون المتغير y‏ والمتغير x‏ 
عبارة عن متوسطات أو معدلات أو نسبء ويكون المتغير w‏ عبارة عن عدد 
أفراد (مدن أو مدارس.. (all‏ تمثل مجموع كل مشاهدة في البيانات» وإذا 
كان المتغير بر والمتغير × تمثل مستويات فردية وأوزانها تشير إلى عدد 
المشاهدات cb Shall‏ فيمكننا استخدام الأوزان التكرارية «[fweight = w]‏ قم 
بطباعة الأمر help survey‏ للحصول على معلومات عن الأوزان التي تعكس 
عناصر التصميم مثل العينات غير المتناسبة (انظر الفصل 4). 

.Svy: regress y X1 x2 x3 

يقوم هذا الأمر بحساب الانحدار المرجح بالدراسة الاستقصائية للمتغير 
بر على المتغيرات 3+ x2,‏ ,1× مفترضاً gl‏ نوع البيانات الاستقصائية تم تحديده 
Üli‏ باستخدام الأمر svyset‏ (انظر الفصل 4(. 


Simple Regression : البسيط‎ jus W 





الملف Nations2.dta‏ يحتوي على بيانات عن مؤشرات التنمية البشرية 


للأمم المتحدة لعدد 194 دولة. 


.use C:\data\Nations2.dta, clear 
.describe country region life school chldmort 
adfert gdp 


storage display value 





variable name type format label variable label 

country str21 5 Country 

region byte 58. 09 region Region 

life float %9.0g Life expectancy at birth 2005/2010 

school float 859.09 Mean years schooling (adults) 
2005/2010 

chldmort float %9.0g Prob dying before age 5/1000 live 

: births 2005/2009 $ 

adfert float $8.0g Adolescent fertility: births/1000 
fem 15-19, 2010 

gdp float 59.09 Gross domestic product per cap 


2005$, 2006/2009 


.summarize life school chldmort adfert gdp 
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Variable Obs Mean Std. Dev. Min Max 
life 194 68.7293 10.0554 45.85 82.76666 
school 188 7.45922 2.959589 1.15 12.7 
chldmort 193 47.65026 52.8094 2.25 209 
adfert 194 51.81443 44.06612 1 207.1 
gdp 179 12118.74 13942.34 279.8 74906 


العمر المتوقع (ife)‏ يُظهر تبايناً واضحاً من دولة لأخرىء فمثلاً الشكل 
)1.7( يوضح أن العمر المتوقع يبدو أنه أقل في أفريقيا عنه في الأماكن 





الأخرى. 
.graph box life, over(region) marker(1,‏ 
mlabel (country))‏ 
8 
S Australis‏ 2 








60 


© Haiti 


Life expectancy at birth 2005/2010 
70 


50 


© Angola 
@ Afghanistan 





Africa Americas Asia 


Europe Oceania 


الشكل )1.7( 


إلى أي مدى يمكن شرح التباين في العمر bliy‏ على متوسط فترة التعليم 
والثروة لكل فرد ومؤشرات التنمية الأخرى؟ قد نقوم بدراسة تأثيرات التعليم 
بو اسطة حساب الانحدار البسيط للعمر المتوقع على متوسط عدد سنوات 
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التعليم» يمكن كتابة أمر الانحدار ببرنامج ستاتا على الشكل cus regress yx‏ 
إن y‏ يمثل المتغير التابع أو المتوقع» x‏ يمثل المتغير المستقل أو التنبؤي. 


.regress life school 


























Source Number of obs - 188 
F( 1, 186) = 206.34 

Model 9846.65406 1 9846.65406 Prob » F = 0.0000 
Residual 8875.86926 186 47.7197272 R-squared = 0.5259 
Adj R-squared = 0.5234 

18722.5233 187 100.120446 Root MSE = 6.9079 








P»|t| [95$ Conf. Interval] 














` .1706856 
1.36924 


2.45184 
50.35941 


14.36 
36.78 


school 2.115112 


47.65817 


2.788569 
53.06065 













_cons 





كما هو متوقع» فإن العمر المتوقع يميل ليكون أعلى في الدول التي بها 
عدد سنوات التعليم أعلى. من السابق لأوانه تفسير هذه النتائج عند هذه 
Ahil‏ ولكن جدول الانحدار يعطي معلومات عن علاقة إحصائية خطيّة بين 
العمر المتوقع life‏ وعدد سنوات التعليم school‏ في الجزء الأيمن العلوي من 
الجدول يمكننا أن نرى نتيجة اختبار F‏ والتي تم إجراؤها sU‏ على مجموع 
التربيعات في الجزء الأعلى الأيسر بالجدول. اختبار FO‏ فرضية العدم 
والتي تكون جميع مُعَاملاتها في جميع متغيرات + في النموذج (في مثالنا هذا 
هناك متغير × واحد وهو (school‏ يساوي صفر اء إحصائية F‏ 206.34 مع 
درجات حرية 1 و186 تشير بشكل واضح إلى رفض فرضية العدم 
)0000. = م التي تشير إلى أربعة أرقام بعد الفاصلة العشريةء وهذا يعني da‏ 
«(p< .00005‏ فعندما يكون ‏ > Prop‏ فهذا يعني "احتمالية أن إحصائية F‏ تكون 
كبيرة" إذا قمنا باستخراج العديد من العينات العشوائية من المجتمع الذي 
تكون فيه فرضية العدم صحيحة. 

في الجانب الأعلى الأيمن» يمكننا أن نرى ales‏ التحديد 0.5259 = R?‏ 
عدد سنوات التعليم يشرح حوالي %53 من التباين في العمر المتوقع» م 
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المعدلة 0.5234 = ۸ تأخذ في الاعتبار تعقيد النموذج بالمقارنة إلى تعقيد 
البيانات. 

"m‏ السفلي من جدول الانحدار» يوضح النموذج المناسب نفسه. 
حيث asi‏ أن المُعاملات (الميل والتقاطع مع المحور الرأسي) في العمود 
الأول» قيمة المعامل للمتغير school‏ تساوي 2.45184 والتقاطع مع المحور 
الأفقي (تم إدراج cons à all‏ ) بالعمود الأول وهي تساوي 50.35941 
وبهذا فإن معادلة الانحدار للعمر المتوقع سوف تكون: 

life = 50.36 + 2.45school‏ المتوقع 

كل سنة إضافية في aac‏ سنوات التعليم سوف تؤدي إلى زيادة العممر 
المتوقع بمقدر 2.45 سنة. هذه المعادلة تقدر بأن العمر المتوقع هو 50.36 
سنة في الدولة التي يكون فيها متوسط سنوات التعليم صفراء هذا بالرغم من 
أن أقل قيمة في عدد سنوات التعليم بالبيانات الموجودة لدينا هو 1.15 سنة 
(وهو في دولة موزمبيق). 

العمود الثاني» يعرض الأخطاء المعيارية المقدترة «CDL all‏ وهذه 
الأخطاء يمكن استخدامها لحساب اختبارات ۲ (الأعمدة 4-3) وفترات القفة 
(الأعمدة 6-5) لكل معامل من مُعاملات الانحدارء إحصائيات /(المُععاملات 
قسمة أخطائها المعيارية) تختبر فرضيات العدم التي تفترض CDL ob‏ 
المجتمع المتناظرة تساوي صفراء عندما تكون مستويات الثقة عند 0.05 = a‏ 
أو 0.001 = a‏ يمكننا رفض فرضية العدم المتعلقة بالمُعاملين الخاصين بمتغير 
school‏ وتقاطع المحور العموديء GY‏ الاحتمالين يظهران على أنهما ”0.000“ 
(وهذا يعني أن 0.0005 > = (p‏ وفي العادة فإن حسابات ستاتا تعرض فترات 
ثقة عند مستوى 9695 ولكن نستطيع إضافة مستويات أخرى لفترات a i‏ 
وذلك من خلال تحديدها بالخيار devel‏ فمثلاً لعرض فترة ثقة عند مستوى 
9 قم بطباعة الأمر 

-regress life school, level(99) 
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بعد تحديد نموذج الانحدار يمكننا إعادة عرض النتائج بطباعة الأمر 
regress‏ فقط بدون إضافة أي متغيرات أخر «s‏ طباعة الأمر regress, level(90)‏ 
سوف يُعيد النتائج» وهذه المرة يعرض فترة ثقة %90- وحيث إن بيانات 
الملف 6 التي تم استخدامها في هذا Qual‏ لا Qui‏ عينة عشوائية 
من بعض المجتمعات في بعض «J yall‏ فإن اختبارات الفرضيات وفترات الثقة 
تفتقد للتفسير الواقعي. 


متوسط سنوات التعليم في بعض الدول تمتد ما بين 1.15 إلى 2.7 
ماذا يمكن لمتوسط العمر المتوقع أن يفعل مع نموذج التوقع للدول الموجودة 
لديناء فمثلا ماذا يعني أن متوسط سنوات التعليم هو 2 أو 12؟الأمر 
5 يوفر طريقة سريعة لمراجعة المتوسطات المتوقعة مع فترات ثقتها 
واختبارات z‏ (والتي تكون في العادة غير مهمة) وما إذا كانت هذه 
المتوسطات تبتعد عن الصفرء الخيار vsquish‏ "التخفيض العمودي" يقلل عدد 
الأسطر لكايه ين لعف ين الجدول. 


.regress life school, level(99) 


Adjusted predictions Number of obs z 188 
Model VCE : OLS 

Expression : Linear prediction, predict() 

1. at : school = 2 

2. at : school = 12 










Delta-method 
Margin Std. Err. z P»|z| [95$ Conf. Interval] 






















55.26309 
79.78149 






1.059291 
.9244047 


52.17 
86.31 


0.000 
0.000 


53.18692 
77.96969 


57.33927 
81.59329 


عندما يكون المتغير school‏ يساوي 2( فإن متوسط العمر المتوقع 
يساوي 55.26 سنة مع فترة ثقة تتراوح بين 53.19 إلى 57.34« وعندما 
يكون المتغير school‏ يساوي 12( فإن متوسط العمر المتوقع يساوي 79.78 
سنة مع فترة ثقة تتراوح بين 8 إلى 681.59 ويمكننا Qs‏ على 
متوسطات العمر المتوقع لقيم asad‏ اوور din 4 MEG ste‏ واحدة من 2 
إلى 12 ونتائج الرسم البياني: وذلك بطباعة أمرين اثنين هما: 





282 الإحصاء مع برنامج ستاتا 


.margins, at(school = (2(1)12)) vsquish 
.marginsplot 
الانحدارء وهو في‎ Cub يعبر عن‎ cons في جدول الانحدار المصطلح‎ 
يساوي الميل على المحور‎ cons العادة يساوي واحد (إذن قيمة معامل‎ 
العمودي). ستاتا يقوم تلقائيا بتضمين ثابت معين ما لم نقم نحن بتغيير ذلك‎ 
Pre, ب‎ pre pe rer وول فة‎ Jed. 
باستخدام المعادلة الأصلية:‎ 
. 2602688 y x, nocons 
في بعض التطبيقات» قد نحتاج إلى تحديد ثابت معين» فإذا كانت‎ 
يستخدم‎ (Mine c dau!) متغيرات الطرف الأيمن تتضمن ثابتاً قمنا بتحديده‎ 
-nocons من الخيار‎ Yo hascons الخيار‎ 
.regress y c x, hascons 
في هذا الموضع يؤدي إلى نتائج مضللة في‎ nocons استخدام الخيار‎ 
قم بالاطلاع على‎ hascons لمزيد من المعلومات عن الخيار‎ «Rg F اختبار‎ 
-help regress أو قم بطباعة الأمر‎ Base Reference Manual Ya 


كبير مع انتشار البيانات» مع تحديد "أفضل تناسب" بواسطة معيار طريقة 
المربعات الصغرى (OLS)‏ هناك طريقة سهلة لرسم هذا lil‏ في داخل 
شكل الانتشار (twoway scatter)‏ مع تناسب خطي (fit)‏ في الرسم البياني 
نفسه؛ الأمر أدناه يقوم بإنشاء نسخة مبسسطة (لن يتم عرضها هنا). 
-graph twoway scatter life school || 1£it life‏ 
school‏ 
معادلة الانحدار كنصء أسماء المتغيرات school life‏ تم كتابتها بخط مائل 
في الرسم البياني. 
graph twoway scatter life school || 1fit life‏ 
School‏ 


|| , 1egend(of£) ytitle("Life expectancy in 
years") 
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text(85 4 "predicted (it:life) - 50.56 + 
2.45(it:school)") 


90 


predicted //fe = 50.36 + 2.45schoo/ 





70 80 


Life expectancy in years 
60 


2 4 6 8 10 12 
Mean years schooling (adults) 2005/2010 


الشكل )2.7( 


Correlation : الارئباط‎ 


الانحدار بطريقة المربعات الصغرى (OLS)‏ يُظهر خط التناسب 
المستقيم» ومُعَامل ارتباط لحظة التوقع لبيرسون يشرح كيف يمكن لخط 
التناسب أن يظهر بشكل أفضلء الأمر correlate‏ يقوم بحساب GL LLG jy!‏ 
للمتغيرات المدرجة بالأمر: 
-correlate gdp school adfert chidmort life‏ 


(obs=178) 





gdp school adfert chldmort life 
gdp 1.0000 
school : 0.5717 1.0000 
adfert -0.5121 -0.6798 1.0000 
chldmort -0.5160 -0.7724 0.7888 1.0000 


life 0.6062 0.7313 -0.7424 -0.9294 1.0000 
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الأمر :correlate‏ يحسب الارتباطات ely‏ على المشاهدات الموجودة فى 
كل aa‏ اك ار iste Wel deal acd‏ أن oos‏ أن تناك 
178 دو Al‏ فقط من أصل 4 دولة في ملف البيانات Nations2.dta‏ لديها 
بيانات ALIS‏ للمتغيرات الخمسة جميعاء هذه الدول 178 تتشابة مع مجموعة 
فرعية من المشاهدات التي يمكن استخدامها في النماذج المتناسبة مثل تحليل 
الانحدار المتعدد الذي يتضمن كل هذه المتغيرات. 

المحللون لا يستخدمون الانحدار أو تقنيات متعددة المتغيرات» ولكن 
La)‏ يفضلون حساب الارتباطات Ely‏ على كل المشاهدات المتوافرة لكل 
زوج من المتغيرات» الأمر pweorr‏ (الارتباط الثنائي) يقوم بإجراء هذه 
الحسابات؛ كما يمكن أيضا إجراء احتمالات اختبار + لفرضية العدم لكل 
ارتباط فردي يساوي صفراء في المثال أدناه الخيار star(.05)‏ يطلب وضع 


يوس م 


نجمة )* *) للارتباطات ذات معنوية إحصائية" عند مستوى ثقة 0.05 = a‏ 


-pwcorr gdp school adfert chldmort life, 
star(.05) 





gdp school adfert chldmort life 
gdp 1.0000 
school 0.5733* 1.0000 
adfert -0.5171* -0.6752* 1.0000 
chldmort -0.5160* -0.7727* 0.7774* 1.0000 
life 0.6112* 0.7252* -0.7318* -0.9236* 1.0000 


هذا الأمر مهم» وسوف نستخدمه لاحقاء ولكن إذا قمنا باستخراج العديد 
من العينات العشوائية من مجتمع فيه ارتباط كل المتغيرات يساوي صفراء 
فإن نحو %5 من ارتباطات العينات سوف تكون ذات معنوية إحصائية عند 
مستوى ثقة 0.05( المحللون المبتدئون الذين يختبرون العديد من الفرضيات 
الفردية مثل تلك التي في مصفوفة cipwcorr‏ لتحديد الجزء ذي المعنوية 
الإحصائية عند مستوى AD‏ 5 نقوم بحساب مخاطرة الحصول على الخطاً 

من النوع الأول عند مستوى أعلى من 0.05« هذه المشكلة يُطلق عليها Ges!‏ 
خطأ المقارنات المتعددة؛ الأمر pweorr‏ يعطي طر يقتين لتعديل مستويات 
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المعنوية وأخذ مشكلة خطأ المقارنات المتعددة في الاعتبار. وهاتان الطريقتان 
هما بونفيروني وسيداك .Bonferroni and Sidak‏ بالطبع طريقة سيداك ليست 
دقيقةء ولكن احتمالات اختبار المعنوية يمكن تعديله لعدد المقارنات التي تم 
إجراؤها. 


.pwcorr gdp school adfert chldmort life, sidak 
sig star(.05) ; 





gdp school adfert chldmort life 
gdp 1.0000 
school 0.5733" 1.0000 
0.0000 
adfert -0.5171* -0.6752* 1.0000 
0.0000 0.0000 
chidmort -0.5160* -0.7727* 0.7774* 1.0000 
0.0000 0.0000 0.0000 
life 0.6112* 0.7252* -0.7318* -0.9236* 1.0000 


0.0000 0.0000 0.0000 0.0000 


التعديلات لها تأثير ات بسيطة على الارتباطات المعتدلة والقوية» كما في 
الجدول eÍ‏ ولكن هذا قد ju PORA‏ مع الارتباطات الضعيفة أو مع 
عدد أكثر من المتغيرات. وبشكل عام كلما زادت المتغيرات التي نقوم 
بحساب ارتباطاتهاء فإن الاحتمالات المعدلة سوف تزيد عن نظيراتها غير 
المعدلة. انظر دليل المستخدم Base Reference Manual‏ للحصول على تفاصيل 
أكثر عن الأمر oneway‏ للمعادلات المستخدمة. 

وحيث إن ارتباطات بيرسون تقيس إلى أي مدى خط الانحدار 01.5 
متناسب» فإن مثل هذه الارتباطات تشترك مع فرضيات ونقاط ضعف ‘OLS‏ 
وبشكل عام» فإن الارتباطات لا ينبغي تفسيرها دون النظر إلى شكل الانتشار 
المتعلق بهاء ومصفوفات شكل الانتشار تعتبر طريقة سريعة للقيام بهذه 
العمليةء وذلك باستخدام نفس التنظيم كمصفوفة ارتباطء الشكل )12.3( في 
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الفصل Q)‏ يعرض مصفوفة شكل الانتشار المتعلقة بالأمر pweorr‏ التي تم 
ذكره سابقا. الوضع الافتراضي هو قيام الأمر graph matrix‏ بحذف ثنائي 
مثل ما agi‏ به الأمر cpweorr‏ لذا فإن كل شكل انتشار صغير يعرض كل 
المشاهدات الموجودة Dad‏ في زوج المتغيرات الموجود DTU‏ 

للحصول على مصفوفة شكل انتشار تتوافق مع الأمر correlate‏ أو 
الانحدار المتعدد من كل المشاهدات التي بها قيم مفقودة مهملة يجب علينا 
تعديل الأمر. إحدى طرق التعديل تتم باستثناء المشاهدات التي بها قيم مفقودة 
في أي متغير مدرج بالأمرء وذلك (!missing) “Ul. deu‏ (الشكل 3.7). 

-graph matrix gdp school adfert chldmort life 


if Imissing(gdp,school,adfert,chldmort,life), 
half msymbol(+) 










Gross 
domestic 
product per 
cap 2005$, 
2006/2009 







Adolescent 
fertility: 
births/1000 












rag Prob dying 
before age 


ay $^ 5/1000 live 
de^ * births 
2005/2009 







Life 
expectancy 
at birth 
2005/2010 






الشكل (7 ,3( يوضح أشياء لم توضحها مصفوفة الارتباط حيث إن 
العلاقات التي تتد تتضمن 088 لكل فرد هي بوضوح علاقات غير خطية؛ 
وبالتالي فإن CDU‏ الارتباط أو الانحدار الخطي تعطي شرحا غير واضح 
لهذه العلاقات واختباراتها المعنوية غير صالحة. 
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إضافة الخيار covariance‏ بعد الأمر correlate‏ يقوم باستخراج مصفوفة 
cui‏ والتغاير بدلا من الارتباطات. 
.correlate w x y z, covariance‏ 
قم بطباعة الأمر أدناه بعد تحليل الانحدار» فسوف يعرض الارتباط بين 
المُعَّاملات المقدّرة» والتي تستعمل أحيانا لتشخيص وجود مشكلة التعدد 
الخطي -multicollinearity‏ 


.estat vce, correlation 
الأمر أدناه سوف يعرض المُعَاملات المقترة لمصفوفة التباين - التغاير‎ 
الأخطاء' المعارية:‎ cl pital dia o الت‎ 

.estat vce 

بالإضافة إلى ارتباطات بيرسون» فإن برنامج ستاتا يمكنه Laj‏ حساب 

aac‏ من الارتباطات الترتيبية» وهذه الارتباطات يمكن اس تخدامها لقياس 

العلاقات بين المتغيرات الترتيبية أو بديل مضاد القيم المتطرفة لارتباط 

بيرسون لحساب المتغيرات» وللحصول على ارتباط الرتب لسبيرمان بين 

متغير life‏ ومتغير school‏ وهو مكافئ لارتباط بيرسون إذا تم وضع هذه 
المتغيرات في شكل ترتيبي» قم بطباعة الأمر 

-spearman life school 


Number of obs - 188 
Spearman's rho - 0.7145 


Test of Ho: life and school are independent 
Prob > |t| = 0.0000 


رتب الارتباطات لكندالزء تاو ) Kendall’s t, (tau-a) and t (o) sly ( Í‏ 
(tau-b)‏ يمكن إيجادها بسهولة لهذه البيانات» (e‏ ولو كان حجم البيانات 
كبيراء فإن حساباتها سوف تكون بطيئة. 


.ktau life school 


Number of obs - 188: 
Kendall's tau-a - 0.5142 
Kendall's tau-b - 0.5149 
Kendall's score =- 9039 
SE of score - B62.604 (corrected for ties) 


Test of Ho: life and school are independent 


Prob > |z| = 0.0000 (continuity corrected) 
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لغرض المقارنة» سوف نقوم بحساب ارتباط بيرسون مع قيمة p‏ غير 
المعدلة كما يلي: 


.pwcorr life school, sig 


life school 





school 0.27252 1.0000‏ 
0.0000 
في هذا المثال قيمة الأمر spearman‏ )0.71( وقيمة pweorr_»—«¥)‏ 
)0.73( كلاهما تعرض ارتباطات أعلى من الأمر ktau‏ )0.51( كل هذه 
النتائج si coul‏ تتفق بأن فرضيات العدم التي تفترض عدم وجوج علاقة يمكن 
رفضها. 
الاحدار اطتعدد : Multiple Regression‏ 


الانحدار البسيط والارتباط أظهرا بأن العمر المتوقع hó‏ بمتوسط 3x.‏ 
سنوات الدراسة Cus school‏ إن عدد سنوات الدراسة تشرح حوالي 7052 
من التباين في العمر eife‏ ولكن هذه العلاقة قد تكون مفاجئة وحدثت هذه 
النتيجة فقط OY‏ المتغيرين يعكسان الوضع الاقتصادي في الدولة؟ هل متغير 
مدة التعليم يعتبر متغيرا مهما عندما نتحكم في التباين بين الدول؟ هل هناك 
عوامل إضافية مع متغير متوسط مدة التعليم يمكن أن تشرح بنسبة أكبر من 
2 التباين في العمر المتوقع؟ الانحدار المتعدد يقوم بالإجابة عن مثل هذا 
النوع من الأسئلة. 

يمكننا إدراج متغيرات تنبؤية أخرى محتملة لمتغير cife‏ وذلك بإضافة 
هذه المتغيرات في الأمر regress‏ فمثلا الأمر التالي سوف يقوم بحساب 
انحدار العمر المتوقع على الناتج المحلي الإجمالي لكل فرد GDP‏ ومعدل 
الخصوبة ومعدل وفيات الأطفال. 

-regress life school gdp adfert chldmort 
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النتائج من الأمر السابق لم يتم إظهارها هناء لأنها سوف تكون مضللةء 
ونحن نعلم من الشكل )3.7( بأن gdp‏ يعرض بوضوح علاقة غير خطية مع 
المتغير 1 والمتغيرات الأخرى» من المفترض أن نعمل مع شكل آخر 
للمتغير gdp‏ بحيث يعرض هذا المتغير علاقات خطية أكثرء اللوغاريتمات 
هي الخيار الأكثر وضوحا وانتشاراً للتحويل؛ وبعد إنشاء متغير جديد يساوي 
لوغاريتم الأساس 10 للمتغير «gap‏ الشكل )4.7( يؤكد بأن علاقات gdp‏ مع 
المتغيرات الأخرى تبدو أقرب لتكون خطية بالرغم من استمرارية بقاء بعض 
العلاقات غير الخطية. 





.generate loggdp = 103910 (gdp) 
.label variable loggdp "1609010 (per cap GDP)" 
.graph matrix gdp loggdp school adfert chldmort 
life 

if !missing(gdp,school,adfert,chldmort,life), 
half msymbol (dh) 












Gross 
domestic 
product per 
Cap 2005$, 
2006/2009 






Mean years 
A schooling 
99 (adults) 

2005/2010 


الشكل )4.7( 


كوكس - بوكس Ul. «Box-Cox‏ سوف نركز على المتغير loggdp‏ ونستعمله 
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في الأمثلة القادمة. حساب انحدار العمر المتوقع على متوسط فترة التعليم 
ولوغاريتم GDP‏ ومعدل الخصوبة ومعدل الوفيات يشرح حوالي 9688 من 
التباين à‏ في العمر المتوقع life‏ 


.regress life school loggdp adfert chldmort 



































Source MS Number of obs - 178 
F( 4, 173) = 321.24 

Model 15545.2558 4 5 Prob » F - 0.0000 
Residual 2092.93402 173 12.0978845 R-squared = 0.8813 
Adj R-squared = 0.8786 

17638.1898 177 99.6507898 Root MSE = 3.4782 




















Coef. Std. Err. (95$ Conf. Interval] 











-.2339704 .1558288 0. -.5415407 .0735999 

loggdp 4.052938 .8133392 4.98 0.000 2.447592 5.658283 
adfert -.0004683 .0096839 -0.05 0.961 -.019582 .0186455 
chldmort -.1511827 . 0098966 -15.28 0.000 -.1707163 -.131649 
62.2544 3.114434 0. 56.10722 68.40158 








معادلة الانحدار المتعدد تكون كما يلي: 
life = 62.25 — 0.23school + 4.05loggdp — 0.00adfert — 0.15chldmort‏ المتو قع 
حيث إن المعادلة أعلاه تعطينا صورة مختلفة عن الانحدار البسيط 
السايق. 


life = 50.36 + 2.45school‏ المتوقع 
عندما نتحكم في المتغيرات الثلاثة الأخرىء فإن مُعَامل المتغير school‏ 
يصبح سالبا وأكثر t‏ (0.23- ضد 2.45+( وليس ذا معنوية إحصائية 
تمكننا من تمييزه عن الصفر .)20.135 م,1.50- (t=‏ معدل الخصوبة له 
معامل واحد على عشرين من الخطأ المعياري من الصفرء وهذا بالطبع ليس 
ذا دلالة إحصائية (f = -0.05, p = 0.961) TON.‏ ومن ناحية أخرىء. فإن 
المتغيرين logedp, chldmort‏ لهما تأثيرات جوهرية وذات Ay gine‏ إحصائية؛ 
العمر المتوقع يميل ليكون أعلى في الدول الغنية التي تتميز بانخفاض 
معدلات وفيات الأطفال. 
ale‏ معدل وفيات الأطفال chidmort‏ يوضح بأن العمر المتوقع ينخفض 
DE‏ 15 ,0 سنةعند ارتفاع معدل وفيات الأطفال بمقدار نقطة واحدة في حالة 


SL 
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بقاء المتغيرات التنبؤية الأخرى على حالهاء معامل loggdp‏ يشير إلى زيادة العمر 
المتوقع بمعدل 5 سنة عند كل زيادة في الناتج المحلي الإجمالي لكل فرد 
(الناتج المحلي الإجمالي أس 10( عند ثبات كل المعدلات الأخرىء الناتج المحلى 
الإجمالي لكل فرد يتباين بدرجة كبيرة في البيانات الموجودة لدينا بمعدل أكبر من 
مائة ضعف» Cus‏ إنه يتراوح من 8 دولار/ للفرد (جمهورية الكونغو 
الديمقراطية) إلى 74,906 دولار/ للفرد (قطر). 

الأربعة متغيرات التنبؤية مع تشرح حوالي %88 من التباين في العمر 
المتوقع (0.8786-,8)» وتعتبر ,8 المعدلة إحصائية مختصرة مفضلّة فى حالة 
الانحدار المتعددء لأنها من غير المحتمل أن تعدل «R(P-0.8813)‏ كما أن Ry‏ 
تفرض elja‏ عند إنشاء نماذج معقدة جدأء Caps Lala R‏ تزداد عندما تقوم 
بإضافة متغيرات تنبؤية أكثرء ولكن R,‏ ربما لا تسلك نفس المسلك. 


التأثير القريب من الصفر للمتغير adfert‏ وضعف تأثيره» والتأثير غير 
المعنوي للمتغير school‏ تشير إلى أن الأربعة متغيرات التنبؤية هي عبارة 
عن تعقيد غير ضروري. إن: إضافة متغيرات تنبؤية لا علاقة لها بالنموذج 
قد تؤدي إلى ارتفاع الأخطاء المعيارية للمتغيرات التنبؤية الأخرى Lage‏ إلى 
انخفاض دقة التقديرات لتلك التأثيرات» (Say‏ الحصول على نموذج SLES‏ 
ومختصرء وذلك باستبعاد المتغيرات التنبؤية التي لم تكن ذات معنوية وذلك 

adfert سوف نقوم باستبعاد المتغير‎ Y f be باستبعاد واحد في كل‎ 
.regress life school loggdp chldmort 



























Source MS Number of obs - 178 
F( 3, 174) - 430.79 

Model 15545.2275 5181.7425 Prob » F = 0.0000 
Residual 2092.9623 12.028519 R-squared = 0.8813 
Adj R-squared = 0.8793 

17638.1898 99.6507898 Root MSE = 3.4662 











[95% Conf. 






Interval] 


school -.233002 .1540928 -1.51 0.132 -.5371337 .0711297 
loggdp 4.056047 .808465 5.02 0.000 2.460387 5.651708 
chldmort -.1514263 .008493 -17.83 0.000 -.168189 -.1346637 
_cons 62.22201 3.032798 20.52 0.000 56.2362 68.20782 





School نقوم باستبعاد متغير‎ e 
.regress life loggdp chldmort 
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Source Number of obs - 178 
Ft 2, 175) = 640.33 

Model 15517.7253 2 7158.86267 Prob » F - 0.0000 
Residual 2120.46446 175 12.1169398 R-squared = 0.8798 
Adj R-squared = 0.8784 

17638.1898 177 99.6507898 Root MSE = 3.4809 















Coef. Std. Err. [95$ Conf. Interval] 








3.510749 .7262322 2.077448 4.94405 
-.1457805 .0076563 -19.04 0.000 -.160891 -.13067 
62.28614 3.043627 20.46 0.000 56.2792 68.29308 









loggdp 
chldmort 
-cons 








انتهينا بنموذج يحتوي على متغيرين تنبؤيين اثنين» وأخطاء معيارية 
منخفضة. وعملياً فإن R^, Aad‏ المعدلة هي نفسها )0.8784 عند وجود 
conn cg aida‏ 5 0.8786 عند وجود Heat‏ متغيرات) وقيمة م املا 
المتغير Joggdp‏ أصبحت أقل بنسبة بسيطة» بينما قيمة معاملات المتغير 
استمرت ثابتة تقر m‏ 

life = 62.29 + 3.5 lloggdp 0.15chldmort‏ المتوقع 

يمكننا حساب القيم المتوقعة لأي مجموعة من قيم المتغيرات loggdp‏ 
و chldmort‏ بواسطة تعويض هذه القيم في معادلة الانحدارء الأمر margins‏ يقوم 
بحساب المتوسطات المتوقعة (تسمى Gad‏ المتوسطات المعدلة) للمتغير التابع عند 
قيم معينة لمتغير مستقل واحد أو أكثرء فمثلاً لمعرفة متوسط العمر المتوقع 
loggdp 5‏ المعدلة عندما تكون قيم المتغير chidmort‏ هي 2« 100« 200- 

margins, at(chldmort = (2 100 200)) vsquish 


Predictive margins Number of obs = 178 
Model VCE : OLS 

Expression : Linear prediction, Predict () 

1._at : chldmort = 2 

2. at : chldmorc = 100 

3. at : chldmortr = 200 










Delta-method 
Margin Std. Err. z P>[z| (95% Conf 
, 







. Interval] 







75.23421 -4408642 170.65 0.000 74.370137 76.09828 
60.94772 -4733418 128.76 0.000 60.01998 61.87545 
46.36966 1.189535 38.98 0.000 44.03822 48.70111 
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جدول الأمر margins‏ السابق» يوضح بأن المتوسط المقدر للعمر 
المتوقع عندما تكون 2 = chidmort‏ خلال جميع القيم المشاهدة للمتغير loggdp‏ 
يساوي 675.23 ويشكل مشابهء فإن المتوسط المقدر للعمر المتوقع عندما 
تكون 0 - chldmort‏ يساوي 7 وإذا قمنا بإدخال الخيار atmeans‏ فإن 
المتغير logedp‏ سوف يساوي قيمة متوسطة معطياً نتائج متساوية في هذا 
المثالء والمخر جات سوف يتم توصيفها بأنها "التوقعات المعدلة" “adjusted‏ 
predictions"‏ بدلا من "الهوامش التنبؤية" ."predictive margins"‏ 

يمكننا أن نقوم بحساب المتوسطات المتوقعة عند قيم محددة للمتغيرات 
chldmort‏ و -loggdp‏ الأو امر التالية تحسب المتوسطات عند ست CAL e gene‏ 
من القيم» عندما يكون المتغير chidmort‏ يساوي 2 أو 100 أو 200« وعندما 
يكون المتغير loggdp‏ يساوي 2.5 أو 4.5. 


.margins, at(chldmort = (2 100 200) loggdp = 
(2.5 4.5)) vsquish 





Adjusted predictions Number of obs = 178 
Model VCE : OLS 
Expression : Linear prediction, predict() 
1..at : loggdp = 2.5 
chldmort z 2 
2. at : loggdp z 2.5 
chldmort = 100 
3. at : loggdp = 2.5 
chldmort = 200 
4. at : loggdp = 4.5 
chldmort = 2 
5. at : loggdp = 4.5 
chldmort - 100 
6. at : loggdp z 4.5 
chldmort = 200 

















Delta-method 
Margin Std. Err. z P>|z| (95$ Conf. Interval] 


a 

1 70.77145 1.244946 56.85 0.000 68.3314 73.2115 
2 56.48496 -718987 78.56 0.000 55.07577 57.89415 
3 41.90691 . 7896567 53.07 0.000 40.35921 43.45461 
4 77.79295 -4312218 180.40 0.000 76.94777 78.63813 
5 63.50646 -9082472 69.92 0.000 61.72633 65.28659 
6 .92841 1.624056 0. .74532 52.1115 
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o M‏ الإحصاء مع برنامج ستتا 


الأمر ادناه marginsplot‏ يقوم بإنشاء رسم بياني لنتائج الهوامش 
5 في الشكل (5:7): 
.narginsplot‏ 


Adjusted Predictions with level(95)% Cis 


70 80 


Linear Prediction 
60 


40 


100 200 
Prob dying before age 5/1000 live births 2005/2009 


—e— loggdp-2.5 —e— loggdp=4.5 


الشكل )5.7( 


للحصول على معاملات الانحدار المعيارية (أوزان بيتا) مع الانحدار 
نقوم بإضافة الخيار DLG cheta‏ المعيارية هي ما يمكن أن نجده في 
الانحدار عندما تكون جميع المتغيرات قد تم تحويلها إلى نتائج قياسية والتي 

متوسطها الحسابي يساوي la‏ وانحرافها المعياري يساوي واحدا. 
.regress life loggdp chldmort, beta‏ 
































Source Number of obs - 178 
F( 2, 175) = 640.33 

Model 15517.7253 2 7758.8627 Prob > F = 0.0000 
Residual 2120.46446 175 12.1169398 R-squared = 0.8798 
Adj R-squared = 0.8784 

17638.1898 177 99.6507898 Root MSE - 3.4809 





Coef. 





Std. Err. 


loggdp 3.510749 -7262322 4.83 0.000 p. .1974935 
chidmort -.1457805 -0076563 -19.04 0.000 d -.7718774 
_cons 


62.28614 3.043627 20.46 0.000 
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معادلة الانحدار المعيارية سوف تكون على الشكل التالي: 
life’ = 0.197loggdp' - 0.778chldmort’‏ المتوقع 


حيث إن life’‏ و loggdp'‏ و chidmort’‏ تشير إلى أن هذه المتغيرات في شكل 
معياري» فمثلا يمكننا تفسير المعامل المعياري للمتغير LS chldmort‏ يلي: 

b; = -0.778‏ يقدّر Gl‏ العمر المتوقع life‏ ينخفض بمقدار 0.778 
انحراف معياري مع كل زيادة بمقدار 1 في الانحراف المعياري لمعدل 
وفيات الأطفال 1 إذا لم يتغير الناتج المحلي الإجمالي loggdp‏ 

اختبارات F‏ وه و۸ والخصائص الأخرى للانحدار تبقى US‏ هي. 





Hypothesis Tests : الفرضيات‎ olus 
هناك نوعان من اختبارات الفرضيات يظهران في جداول مخرجات‎ 
في العينة‎ iiid المشاهدات‎ a الفرضيات تبدأ باعتبار‎ ‘regress الأمر‎ 

لدينا تم سحبها عشوائيا وبشكل مستقل من مجتمع كبير وغير محدود. 
1- اختبار F‏ الشامل: إحصائية F‏ في أعلى اليمين في جدول الانحدار تقيّم 
فرضية العدم في المجتمع» والمُعَاملات لكل المتغيرات في النموذج 
تساوي ag Te"‏ 
72 اختبارات ¢ الفردية: وتظهر في العمودين الثالث والرإبع في جدول 
الارتباط» وتحتوي على اختبارات ١‏ لكل مُعامل انحدار على حدة» وهي 
تقيّم فرضيات العدم في المجتمع التي تفترض Gl‏ المُعاملات لكل متغير 
معين تساوي صفرا. 
احتمالات اختبار + ذات الحدين» واختبارات الجانب الأول تقوم بقسمة 
قيم م بالمنتصف. 
بالإضافة إلى أن اختبارات F‏ وء المعيارية يمكن لبرنامج ستاتا حساب 
اختبارات F‏ لفرضيات يحددها المستخدم» الأمر test‏ يشير إلى النماذج المناسبة 
الأخيرة مثل anova‏ أو regress‏ بالعودة إلى مثالنا السابق الخاص بانحدار 
أربعة متغيرات تنبؤية» بافتراض أننا نريد اختبار فرضية العدم التي Va‏ 
بأن المتغيرين chldmort y adfert‏ (يتم أخذهما بالاعتبار (Lee‏ ليس لهما تأثير. 
.regress life school loggdp adfert chldmort‏ 
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Source Number of obs - 178 
F( 4, 173) - 321.24 

Model 15545.2558 4 3886.31395 Prob < جم‎ = 0.0000 
Residual 2092 .93402 173 12.0978845 R-squared = 0.8813 
Adj R-squared = 0.6786 

17638.1898 177 99.6507898 Root MSE = 3.4782 











Interval] 







Coef. Std. Err. [95$ Conf. 














School -.2339704 .1558288 -1.50 0.135 -.5415407 .0735999 
loggdp 4.052938 .8133392 4.98 0.000 2.447592 5.658283 
adfert -.0004683 .0096839 -0.05 0.961 -.019582 .0186455 
chldmort -.1511827 .0098966 -15.28 0.000 -.1707163 -.131649 
-cons 62.2544 3.114434 19.99 0.000 56.10722 68.40158 





.test adfert chldmort 


(1) adfert = 0 
(2) chldmort = 0 


EC. 2; 173) 
Prob » F 


It 


158.03 
0.0000 


بينما فرضيات العدم الفردية تحدد اتجاهات معاكسة )520 chidmort‏ ذو 
معنوية إحصائية adfert Ul‏ ليس كذلك) الفرضية مجتمعة التي تفترض بأن 
مُعَاملات المتغيزات adfert y chidmort‏ كلاهما يساوي صفرا (Say‏ رفضه 
«(p< 0.00005)‏ تطبيق مثل هذه الاختبارات على مجموعة فرعية من 
المعاملات تعتبر مفيدة عندما يكون لدينا مجموعة من المتغيرات التنبؤية 
الوهميةء أو عندما تكون تقديرات المعاملات الفردية تظهر عدم مصداقية 
نتيجة التعدد الخطي -multicollinearity‏ 
الأمر test‏ يمكنه تكرار اختبار 7 الشامل. 
.test school loggdp adfert chldmort |‏ 


( 1) school 
(2) loggdp 
(3) adfert 
(4) chldmort = 0 


n I 
ooo 


m 
D 
p 
- 
Ww 
[] 


321.24 
0.0006 


"U 
n 
o 
[e] 
v 
m 
1 
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hes aces ad css اع‎ sas e تلقو‎ Sas كنا‎ 

LEHNT LEON TIS‏ لاعن ريك 

الأمر test‏ وهو يساوي مربع إحصائية ؛ في جدول الانحدار )1.50( = 2.25 
وسوف ينتج نفس قيمة „P‏ 

.test school 

(1) school - 0 


F( 1, 2373) = 2.25 
Prob > F = 0.1351 


تطبيقات الأمر test‏ تعتبر ASÍ‏ فائدة عند القيام بأعمال متقدمة (بالرغم 
من أنها عديمة الفائدة بالنسبة للعمر المتوقع في مثالنا هذا) تدضمن التالي: 
1- اختبار ما إذا كان مُعَامل ما يساوي GÀ‏ معينأء فمثلاً لاختبار فرضية 
العدم التي تقول بأن معامل المتغير school‏ يساوي 1 )0= (Ho :Bi‏ نقوم 
بطباعة الأمر: | 
.test school = 1‏ 
2- اختبار ما إذا كان مُعَاملان متساويين» فمثلاً الأمر أدناه يقيّمْ فرضية العدم 
-Ho :B2 = B3‏ 
.test loggdp = adfert‏ 
3- أخيراً الأمر test‏ يستطيع تفهّم بعض التعبيرات الجبريّة» حيث يمكننا 
طلب شيء ما مثل اختبار -Ho B2=(B3+B4)/100‏ 
-test school = (loggdp + adfert)/100‏ 
لمزيد من المعلومات والأمثلة حول الأمر test‏ قم بطباعة help test. yo¥l‏ 


اطتغيرات الوهمية : Dummy Variables‏ 
المتغيرات النوعية يمكن أن تصبح متغيرات تنبؤية في تحليل الانحدار 


عندما يتم التعبير عنها على شكل رقم واحد أو أكثر (0,1) فهي ثنائيات 
سمى متغيرات وهمية. فعلى سبيل المثال» كنا قد لاحظنا وجود اختلاف 
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ج ي TCAE T‏ 


كبير بين مناطق العالم بالنسبة لمتوسط العمر المتوقع (الشكل 1.7(« المتغير 
النوعي region‏ يساوي القيم من 1 (أفريقيا) إلى 5 (الجزر الأستوائية بالمحيط 
الهادي) والتي يمكن إعادة التعبير عن قيم هذا المتغير كمجموعة من خمسة 
متغيرات وهمية )0,1(« الأمر tabulate‏ يوفر طريقة تلقائية للقيام بذلك حيث 
يقوم بإنشاء متغير وهمي واحد لكل فئة للمتغيرات المدرجة فى الأمر عند 
القيام بإدراج الخيار gem‏ (إنشاء). في المثال أدناه فإن المتغيرات الوهمية 
التي تم إنشاؤها تم تسميتها بأسماء من regl‏ إلى regs‏ حيث إن reg!‏ يساوي 
1 للدول الأفريقية وصفر لبقية reg? «Dll‏ يساوي 1 لدول أمريكا وص فر 
لبقية الدول» وهكذا لبقية المتغيرات. 

.tabulate region, gen(reg) 


Region Freq. Percent Cum. 















Africa 
Americas 35 18.04 44.85 
Asia 49 25.26 70.10 
Europe 43 22.16 92.27 


Oceania 





Total 194 


.describe reg* 


storage display value 


variable name type format label variable label 
region byte $8.0g regíon Region 

regl byte %8.0g region==Africa 
reg2 byte %8.0g È region==Americas 
reg3 byte %8.0g region--Asia 
reg4 byte %8.0g region==Europe 
reg5 byte %8.0g region==Oceania 


-label values regl regi 
-label define reg1 0 "others" 1 "Africe' 
-tabulate 26901 region 


region==Af Region 


rica Africa Americas Asia Europe Oceania Total 
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انحدارالمتغير life‏ على متغير وهمي واحد reg]‏ (أفريقيا) هو معادل 
للقيام باختبار ۲ لعينتين اثنتين لمعرفة ما إذا كان متوسط المتغير life‏ هو نفسه 
بالنسبة لفئات treg?‏ وهل متوسط العمر المتوقع يختلف اختلافاً معنوياً بالنسبة 

لأفريقيا مقارنة بقارات العالم الأخرى؟ 
.ttest life, by (regi)‏ 


Two-sample t test with equal variances 





{95% Conf. Interval] 

























142 73.21115 .5068244 6.03951 72.20919 74.21311 
56.49038 1.185937 8.551912 54.10952 58.87125 


others 
Africa 



















combined 68.7293 .7219359 10.0554 67.3054 70.15319 












16.72077 





1.101891 14.5474 18.89413 





diff - mean(others) - mean(Africa) t- 15.1746 

Ho: diff - 0 degrees of freedom - 192 
Ha: diff « 0 Ha: diff !- 0 Ha: diff < 0 

Pr(T « t) - 1.0000 Pr(|T| > |t|} = 0.0000 Pr(T > t) = 0.0000 


.regress life regi 
























Source Number of obs - 194 
F( 1, 192) = 230.27 

Model 10641.4858 10641.4858 Prob » F = 0.0000 
Residual 8872.96636 46.2133664 R-squared = 0.5453 
Adj R-squared = 0.5429 

19514.4521 101.111151 Root MSE = 6.798 





P»|t| [95$ Conf. Interval] 













-16.72077 
73.21115 


1.101891 
.570479 






-15.17 
128.33 


0.000 -18.89413 -14.5474 
0.000 72.08594 74.33636 






اختبار ۲ يؤكد بأن 16.72 سنة اختلاف بين متوسطات أفريقيا 
(56.49) ومناطق العالم الأخرى (73.21) هو اختلاف ذو معنوية إحصائية 
p = 0.000)‏ ,15.17 =( حصلنا على نفس النتائج من انحدار المتغير الوهمي 
Cus (r= -15.17, p = 0.000)‏ إن مُعامل (16.72- = reg (by‏ كما أنه يشير إلى 
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أن متوسط العمر المتوقع 16.72 سنة أقل في أفريقيا عنه في مناطق العالم 
الأخرى )73.21 = (bp‏ 


الشكل )6.7( يوضح Lily‏ انحدار المتغير «quaa gl‏ كل خيارات البيانات 
تم تمثيلها بخط يمتد عبر مجموعتين أفقيتين عند المتغير 1 = reg]‏ (أفريقيا) 
و0 = reg!‏ (غير ذلك)ء لتوضيح هذه النقطة بيانيا هذا المثال يستخدم الخيار 
jitter(5)‏ والذي يقوم بإضافة حجم صغير لكل نقطة في الرسم البياني بحيث 
تظهر على شكل دائرة صغيرة»ء الخيار jitter()‏ لا fy‏ على خط الانحدار 
وهو يربط متوسط المتغير Lue life‏ تكون (0)73.21 = reg!‏ مع متوسط 
المتغير life‏ عندما (0)56.49 = reg]‏ كلا المتوسطين أو القيم المتوقعة يتم 
رسمها باستخدام مربعات مظللة» الفرق بين المتوسطين يساوي ميل الانحدار 
716.72 سنة» يجب ملاحظة أن القيم 0 و1 للمتغير reg]‏ إعادة توصيفها 
بالرسم البياني باستخدام الخيار -graph «Vl xlabel)‏ 


.predict lifehat 
-graph twoway scatter life lifehat regi, 
msymbol(oh S) jitter(5) 

lfit life regl 

, legend(off) xlabel(0 "others" 1 "Africa") 
xtitle("Global region") ytitle("Life expectancy 
in years") 





60 70 80 90 


Life expectancy in years 


50 





Global region 


الشكل )6.7( 
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مناطق العالم الخمس تم التعبير عنها بخمسة متغيرات وهمية» ولكن 
ليس من المحتمل أن يتم تضمين كل المتغيرات الخمسة في نموذج انحدار 
واحد بسبب الارتباط الخطي المتعدد multicollinearity‏ وهي V‏ قيم أي أربعة 
متغيرات من هذه المتغيرات الوهمية لها القدرة على تحديد قيم المتغير 
الخامس» وبالتالي يمكننا تمثيل كل المعلومات للفئة kc‏ لمتغير نوعي ما من 
خلال متغيرات وهمية ۸-1. فمثلا وكما رأينا سابقا بخصوص الناتج المحلي 
الإجمالي لكل فرد (في الشكل اللوغاريتمي (loggdp‏ ومعدل GLa,‏ الأطفال 
la (chldmort)‏ يوضحان حوالي 7688 من التباين في العمر المتوقع» تضمين 
أربعة متغيرات وهمية لمناطق العالم 4-1 يزيد من هذه النسبة لتصبح حوالي 
.(R’,=0.8872) 9689‏ 





.regress life reg1 reg2 reg3 reg4 loggdp 
chldmort 






















Source SS df MS Number of obs - 178 

- F( 6, 171) = 233.00 

Model 15715.8742 6 2619.31237 Prob > F = 0.0000 
Residual 1922.31561 171 11.2416118 R-squared - 0.8910 
Adj R-squared = 0.8872 

17638.1898 17? 99.6507898 Root MSE = 3.3529 





life Coef. Std. Err. t P»|t| [95$ Conf. Interval] 











regl -2.150794 1.211918 0. -4.543041 .2414527 
reg2 1.486722 1.176501 1.26 0.208 -.8356127 3.809057 
reg3 . 9838334 1.129945 0.87 0.385 -1.246603 3.21427 
reg4 1.455465 1.199846 1.21 0.227 - 3 3.823882 
loggdp 3.239467 . 4 4.41 0.000 1.79004 4.688894 
chldmort -.1270253 .0086971 -14.61 0.000 -.1441928 -.1098578 
_cons 62.16206 3.10137 0. 56.04016 68.28396 









كل المتغيرات الوهمية الخاصة بمناطق العالم ليست ذات معنوية 
إحصائية عندما قمنا بإدخالها جميعا وقمنا بالتحكم في المتغيرات loggdp‏ 
COLL tehidmort 5‏ لست ذات Ay dia‏ إحضائية شير إلى“ أن تسود 
أضغر قد يكون أكثر فائدة» ويعطي صورة أكثر وضوحاً للتأثيرات A agal‏ 
الخطوة الأولى نحو تقليص النموذج تتضمن استبعاد المتغير regs‏ وهو 
أضعف متغير تنبؤي» النتائج أدناه توضح أنها أفضل (0.8873-,80) وتعطي 
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تقديرات AS)‏ دقة (أخطاء معيارية أقل) لتأثيرات المناطق الأخرىء ala‏ 
المتغير OY! reg]‏ يظهر ذو معنوية إحصائية. 
.regress life regl reg2 reg4 loggdp chldmort‏ 















Source Number of obs - 178 
F( 5, 172) = 279.84 

Model 15707.3519 3141.47038 Prob » F = 0.0000 
Residual 1930.83792 172 11.2258018 R-squared = 0.8905 
- Adj R-squared = 0.8873 

Total 17638.1898 177 99.6507898 Root MSE 2 3.3505 











(95$ Conf. Interval) 








regl -2.927382 .8199249 0. -4.545793 -1.308972 
reg2 .6920922 .7419319 0.93 0.352 -.7723717 2.156556 
reg4 .6487658 .7618415 0.85 0.396 -.8549968 2.152528 
loggdp 3.273944 .7326992 4.47 0.000 1.827705 4.720184 
chldmort -.1269767 . 0086908 -14.61 0.000 -.1441311 -.1098224 
.cons 62.82061 3.00561 0. 56.88798 68.75324 









الخطوة التالية» استبعاد المتغير regd‏ ثم أخيرا reg?‏ النتائج في النموذج 
المصغر مازالت توضح %89 من التباين في العمر المتوقع (0.83879-,2م) 

ولكن مع ثلاثة متغيرات تنبؤية فقط. 
.regress life reg1 loggdp chldmort‏ 







Source 


















Number of obs - 178 

F( 3, 174) = 468.34 

Model 15694.5388 5231.51293 Prob » F - 0.0000 
Residual 1943.65102 174 11.1704082 R-squared = 0.89898 
i Adj R-squared = 0.8879 

Total 17638.1898 177 99.6507898 Root MSE = 3.3422 


life Coef. Std. Err. È P»|t| [95$ Conf. Interval) 









regl -3.143763 .7901811 -3.98 0.000 -4.703336 -1.584189 
loggdp 3.414611 . 6977087 4.89 0.000 2.037549 4.791672 
chldmort 


-.1277141 .0086406 -14.78 0.000 


-.144768 -.1106603 
62.65707 2.923818 21.43 0.000 


56.88636 68.42779 


-Cons 


من هذا التحليل الإحصائيء يمكننا أن نستنتج أن الاختلافات في العمر 
المتوقع بين مناطق العالم المختلفة كانت بسبب التباين في الصحة sas‏ 
وفيات JULY‏ ولكن في أفريقيا هناك ظروف أخرى لها تأثيرها (مثل 
الحروب) التي تقلل مَنَ العمر المتوقع. 
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olw‏ التفاعلية : Interaction Effects‏ 


الجزء السابق شرح ما يمكن أن يسمى "المتغيرات الوهمية då ahta‏ 
GY‏ مُعاملاتها تزداد لتؤثر في تقاطع معادلة الانحدار مع المحور العمودي 
مقارنة بين مجموعات 0 و1. هناك استخدام آخر للمتغيرات الوهمية وهي 
e ji oua‏ توا علي "Loa Jl cd yall id cau‏ وذلك Rial ci jn‏ 
الوهمي في قياس المتغير. في هذا الجزء.سوف نستمر في استخدام ملف 
بيانات Nations2.dta‏ ولكن نأخذ في الاعتبار بعض المتغيرات المختلفة» وهي 
انبعاث ثاني أكسيد الكربون لكل فرد «(co2)‏ نسبة عدد السكان الذين ا 
في المناطق الحضرية urban)‏ والمتغير الوهمي الرابع reg‏ الذي يساوي 1 
للدول الأوروبية و0 غير ذلك» نبدأ بتوصيف قيم المتغي ر 84 وحساب 
لوغاريتم للمتغير 2 بسبب الالتواء الموجب الكبير. 
.label values reg4 reg4 ;‏ 
.label define reg4 0 "others" 1 "Europe‏ 
-generate logco2 - log10(co2)‏ 


-label variable logco2 "log10(per cap CO2)' 
.describe urban reg4 co2 logco2 





Storage display value 
variable name type format label variable label 
urban float %9.0g Percent population urban 2005/2010 
reg4 byte  $8.0g reg4 region==Europe 
602 float %9.0g Tons of CO2 emitted per cap 2005/2006 
logco2 float %9.0g log10 (per cap C02) 


نقوم بإنشاء مصطلح تفاعلي أو ميل متغير وهمي يُسمى urb reg4‏ وذلك 
بضرب المتغير الوهمي reg4‏ في قياس المتغير «urban‏ المتغير الناتج وهو 
urb reg4‏ يساوي urban‏ للدول الأوروبية وصفر لدول العالم الأخرى. 


... generate urb reg4 = urban * reg4 
label variable urb reg4 "interaction 
urban*reg4 (Europe)' 


انحدار المتغير logco2‏ على المتغير urban‏ و المتغير reg4‏ وشرط 
التفاعل urb reg4‏ يعطي نموذجا يختبر ما إذا كان تقاطع المحور العمودي y‏ 
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3 الميل المتعلق بالمتغير logco2?‏ على المتغير Lay urban‏ يختلف لدول 
اوروبا عن باقي دول العالم. 


.regress logco2 urban reg4 urb reg4 

























Source Number of obs - 185 
F( 3, 181) - 72.86 

Model 55.8882644 18.6294215 Prob » F - 0.0000 
Residual 46.2772694 .255675521 R-squared 2 0.5470 
Adj R-squared = 0.5395 

102.165534 184 .555247466 Root MSE = .50564 















logco2 [95$ Conf. Interval] 








urban .0217385 .0017762 .0182339 .0252431 
reg4 1.294163 .462044 2.80 0.006 .3824774 2.205848 
urb. reg4 -.0133405 .0065573 -2.03 0.043 -.0262791 -.0004019 
-cons -.4682452 . 1007257 -.6669929 -.2694975 









التأثير التفاعلي ذو معنوية إحصائية )0.043 = م) يشير إلى أن العلاقة 
بين نسبة السكان الذين يعيشون بالمناطق الحضرية urban‏ ولوغاريتم انبعاث 
ثاني أكسيد الكربون Jogco2‏ تختلف في الدول الأوروبية عنها في بقية دول 
العالم» التأثير الرئيس للمتغير urban‏ هو تأثير إيجابي )0.0217( ويعني أن 
2 يميل ليكون أعلى في الدول التي يكثر فيها الناس الذين يعيشون في 
المناطق الحضريةء ولكن التأثير التفاعلي سلبي وهذا يعني أن الميل الأعلى 
يكون أقل حدة لدول أوروباء وعليه يمكننا صياغة النموذج أعلاه في معادلتين 
اثنتين هما: ` 

,reg4 =1:‏ أوروبا 


logco2 = -0.4682 + 0.0217urban + 1.2942(1) — 0.0133urban(1)‏ المتوقع 


=-0.4682 + 1.2942 (0.0217 — 0.0133)» ban 
70.826 + 0.0084urban 


GAY الدول‎ , roga - 0 : 


logco2- -0.4682 + 0.0217urban + 1 .2942(0) - 0.0133urban(0^‏ المتوقع 
0.0217urban ad‏ + 0.4682- = 


بعد إجراء تحليل «laa!‏ فإن predict newvar jay!‏ يقوم بإنشاء متغير 
جديد يتضمن القيم المتوقعة من آخر انحدارء ويمكن إنشاء رسم بياني للقيم 
المتوقعة في هذا المثال لإظهار التأثير التفاعلي بيانياً (شكل 7.7( الخط في 
الجانب الأيسر (0 = (reg4‏ من الرسم له ميل 0.0217 وتقاطعه مع المحور 
العمودي Ld (70.4682 y‏ الخط في الجانب الأيمن من الرسم )1 = (regd‏ له 
ميول أقل حدة (0.0084) ونقطة تقاطع أعلى مع المحور العمودي بر 
(0.826)» النتائج تشير إلى أنه لا as‏ دولة أوروبية شهدت انخفاضا في 
axe‏ السكان في المناطق الحضريةء وانخفاضاً في انبعاث ثاني أكسيد 
الكربون. 
.predict co2hat‏ 
-graph twoway scatter logco2 urban, msymbol(oh)‏ 


|| connect co2hat urban, msymbol(*) 
|| , by(reg4) 


others Europe 








0 50 100 0 50 100 
Percent population urban 2005/2010 


9 log10(per cap CO2)  ———— Fitted values 


Graphs by region==Europe 
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المتغير ات Cus bvarname, evarname‏ إن الحرف الأو ل من اسم متغير 
له إشارة معينة» فالحرف :يعني مؤشر (indicator)‏ والحرف ع يشير إلى 
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الاستمرارية (continuous)‏ والتي سبق الإشارة إليها في الفصل )6(. هذه 
الحروف تعطي طريقة بديلة لتضمين التفاعلات» الرمز # يحدد التفاعل بين 
متغيرين اثنين» و## التفاعل المشترك والذي يتضمن تلقائيا كل تفاعلات 
المستوى الأقل متضمناً هذه المتغيرات» المتغير regé‏ هو عبارة عن متغير 
مؤشر والمتغير urban‏ هو متغير مستمرء إذن نفس النموذج الذي سبق 
صياغته سابقا يمكن الحصول عليه بواسطة الأمر: 

.regress logco2 c.urban i.reg4 c.urban#i.reg4 

وهذا يكافئ التفاعل العاملي: 


.regress logco2 c.urban##i.reg4 

























Source Number of obs - 185 
F( 3, 181) - 72.86 

Model 55.8882644 3 18.6294215 Prob > F = 0.0000 
Residual 46.2772694 181 .255675521 R-squared = 0.5470 
Adj R-squared = 0.5395 

102.165534 184 .555247466 Root MSE = .50564 










logco2 P»|t| (95% Conf. Interval] 








urban .0217385 -0017762 12.24 0.000 .0182339 .0252431 


l.reg4 1.294163 . 462044 2.80 0.006 . 3824774 2.205848 
reg4#c.urban 

1 -.0133405 . 0065573 -2.03 0.043 -.0262791 -.0004019 

_cons -.4682452 .1007257 74.65 0.000 -.6669929 -.2694975 





الأمر margins‏ يفهم بان # أو ## علاقات تفاعلية» نسبة الذين يعيشون 
في المناطق الحضرية في البيانات تتراوح بين 0 إلى 476100 ويمكننا 
إنشاء رسم بياني للعلاقات الفاعلية» أولا نحسب المتوسطات المتوقعة للمتغير 
logco2‏ عند عدة مستويات من المتغير urban‏ )10 40. 70 أو 100( 
والمتغير reg4‏ )0 3 1( 


-margins, at(urban = (10(30)100) reg4 = (0 1)) 
vsquish á 
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Adjusted predictions Number of obs = 185 
Model VCE : OLS 
Expression ; Linear prediction, predict() 
l._at : urban = 10 
reg4 = 0 
2..at : urban = 10 
reg4 = 1 
3._at : urban = 40 
reg4 = 0 
4..at : urban = 40 
reg4 = ah 
5. at : urban = 70 
reg4 = 0 
6. at : urban = 70 
reg4 = 1 
7..at : urban z 100 
regá = 0 
B. at : urban = 100 
reg4 = T 







Delta-method 
Margin Std. Err. z P»|z| [95$ Conf. Interval] 









at 

1 -.2508599 .084864 -2.96 0.003 -.4171903 -.0845296 
2 .9098981 .3890654 2.34 0.019 .147344 1.672452 
3 .4012958 .046435 8.64 0.000 .3102849 .4923067 
4 1.161839 .2080449 5.58 0.000 . 7540788 1.5696 
5 1.053452 .052811 19.95 0.000 ~. 9499438 1.156959 
6 1.413761 . 0831383 17.01 0.000 1.250833 1.576729 
7 1.705607 .0953954 17.88 0.000 1.518636 1.892579 
8 1.665722 .2055716 8.10 0.000 1.262809 2.068635 





الخطوة التالية هي استخدام الأمر marginsplot‏ لرسم هذه المتوسطات» 
لاحظ أنه تم استخدام خيارات مع الأمر twoway‏ لتوصيف تفاصيل الرسم 
البياني» الشكل )8.7( يعرض نفس النموذج الذي يعرضه الشكل )7.7( ولكن 
بتنسيق مختلف يعرض فترات الثقة للمتوسطات المتوقعة بدلا من نقاط 
البيانات» الخيار في الأمر marginsplot‏ يحدد 12 (حرف "إل" ثم رقم 2( .e‏ 
عنوان المحور في الجانب الأيسر من الرسم. 


emarginsplot, 12("Log(subscript:10) 
(CO{subscript :2} 


per capita)") xlabel (10 (30) 100) 
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Adjusted Predictions with level(95)% Cls 


1 1.5 


Linear Prediction 
5 


Log:o (CO: per capita) 


40 70 100 
Percent population urban 2005/2010 
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التأثيرات التفاعلية يمكن أن تتضمن قياسات متغيرين» وهناك طريقة 
تسمى التمركز تساعد في تقليص مشاكل الارتباط المتعدد multicollinearity‏ 
مع مثل هذه التفاعلات» وتجعل تأثيراتها الرئيسة أسهل للتفسير. التمركز 
يتضمن طرح متوسطاتها من المتغيرات قبل تحديد شرط التفاعل كمنتج لهذا 
التمركز. ومتغيرات التمركز لها متوسطات تساوي صفر! تقرييا وتكون 
سالبة للقيم الأقل من المتوسط. الأمر أدناه يحسب إصدار التمركز للمتغيرات 
urban, loggdp‏ ويعطيها اسمه urbano, loggdp0‏ وشرط التفاعل urb gdp‏ يتم 

loggdp0 ضرب‎ urban0 تعريفه على أنه ناتج‎ 
.sSummarize urban loggdp 





Variable Obs Mean Std. Dev. Min Max 
urban 194 55.43488 23.4391 10.25 100 
loggdp 179 3.775729 .5632902 2.446848 4.874516 


.generate urban0 = urban - 55.4 
.label variable urban0 "Percent urban, 
centered" 


generate loggdp0 = loggdp - 3.78 
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.label variable 1099320 "log10(GDP per cap), 
centered" 

.generate urb gdp = urbanO * loggdpO 

.label variable urb gdp "interaction 
urban0*loggdp0" 


تمركز أكثر دقة يمكن القيام به باستخدام المتوسطات التي يستخرجها 
الأمر -summarize‏ 


.summarize urban 
-generate urban00 = urban - r(mean) 


قد نقوم باستبعاد كل المشاهدات التي تحتوي على قيم مفقودة في أي 
متغيرات عند حساب الانحدار قبل الحصول على المتوسط لغرض التمركز. 
حساب انحدار Jogeo2‏ على التأثيرات الأساسية المركزية للمتغير 
loggdpO‏ والمتغير urband‏ مع شرط التفاعل urb gdp‏ سوف يوضح أ 
التأثير التفاعلي سالب وذو معنوية إحصائية. 
.regress logco2 loggdp0 urban0 urb gdp‏ 





Source 





















SS df MS Number of obs - 175 

Fí- 3; 171) = 371.66 

Model 83.4990753 27.8330251 Prob > F = 0.0000 
Residual 12.806051 .074889187 R-squared = 0.8670 
Adj R-squared = 0.8647 

96.3051263 553477737 Root MSE = .27366 










logco2 





(95% Conf. Interval] 








loggdpO 
urbanO 
urb, gdp 
-cons 


1.116759 .0558107 20.01 0.000 1.006592 1.226925 
.0024787 .0013689 1.81 0.072 -.0002235 .0051809 
-.0082808 .0017418 -4.75 0.000 = 5011719 -.0048425 
.8950411 .0267376 .8422628 .9478194 











نفس الانحدار يمكن حسابه ورسمه للمتغيرات المستمرة باس تخدام 
الأوامر الثلاثة أدناه (النتائج لن يتم عرضها).. 
.regress logco2 © . 10909050 c.urbanO‏ 
c.loggdpOiic.urbanO‏ 


margins, at(loggdp0 = (-1.3 1.1) urban0 =( -45 
45)) 


.marginsplot 
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التأثيرات الأساسية للانحدار من هذا النوع عند إجراء تمركز للمتغيرات 
التفاعلية يمكن تفسيره كتأثير لكل متغير عندما تكون قيم المتغيرات الأخرى 
عند chu gall‏ لذا فإن Jogco2‏ المتوقع يزداد بمقدار 1.12 عند زيادة وحدة 
واحدة في المتغير loggdp‏ عندما يكون المتغير urban‏ عند قيمته Ah u giall‏ 
وبالمثل فإن Jogco2‏ المتوقع يزداد بمقدار بسيط )0.0025( عند زيادة وحدة 
واحدة في المتغير urban‏ عندما يكون المتغير Joggdp‏ عند قيمته المتوسطة؛ 
معامل شرط التفاعل urb_gdp‏ يوضح بأن كل زيادة وحدة واحدة في عدد 
السكان الذين يعيشون في المناطق الحضرية تؤدي ضعف تأثير loggdp‏ على 
2 بمقدار 0.008-», كما أن زيادة انبعاث ثاني أكسيد الكربون تزداد 
بزيادة الثروة» ولكن هذه الزيادة هي أقل حدة في المناطق الأكثر تحضرا. 


Robust Estimates of Variance : Gulu) اطوئوقة‎ olp 


الأخطاء المعياريةء واختبارات الفرضيات التي تصاحب الانحدار العادي 
(مثل الانحدار والتباين) تفترض بأن الأخطاء تتبع التوزيعات المستقلة 
والمتطابقة» وإذا كان هذا الافتراض غير صحيح» فإنه من المحتمل أن 
الأخطاء المعيارية سوف تقلل من أهمية التباين من عينة لأخرىء وتعطي 
d Aug 6.4 ys AB CH d‏ االات dao diss Anal‏ ااال 
مع هذه المشكلة والتي تسمى اختلاف llتبlيj heteroskedasticity‏ فإن الأمر 
regress‏ وبعض الأوامر المناسبة الأخرى بها خيار يقوم بتقدير الأخطاء 
المعيارية بدون الاعتماد على فرضيات قوية أو أحياناً ضعيفة للاستقلالية أو 
الاعتماد على أخطاء التوزيع المتماثلة» هذا الخيار يستخدم مدخلا تم اشتقاقه 
بشكل مستقل من هوبر ووايت وآخرين Huber, White and others‏ ويشار aal‏ 
أخيانا شطين:ة مقر Cola‏ 

للحصول على معلومات أكثر عن هذا الخيارء قم بطباعة help vee jay]‏ 
option‏ أو انظر vce option‏ في دليل المستخدم Stata Reference Manual‏ 
للحصول على تفاصيل تقنية أكثر. 
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الجزء السابق شرح انحدار Jogeo?‏ على ثلاثة متغيرات تنبؤية loggdp(),‏ 
urban()‏ ونتائجها «urb. gdp‏ ولتكرار نفس الانحدار oS s‏ مع أخطاء معيارية 
موثوقة سوف نقوم بإضافة الخيار .vee(robust)‏ 


.regress logco2 1069320 urban0 urb gdp, 
vce(robust) 


Linear regression Number of obs - 175 
F( 3, 171) = 410.66 
Prob > F = 0.0000 
R-squared = 0.6670 
Root MSE = .27366 






"Robust 
Coef. Std. Err. t P»|t| [95$ Conf. Interval] 










logco2 







loggdpO 
urbanO 
urb gdp 
_cons 





1.116759 0525277 1.013072 1.220445 
- 0024787 .0013123 1.89 0.061 -.0001116 .005069 
-.0082808 .0016976 -4.88 0.000 -.0116317 -.0049298 
.8950411 .0271616 32.95 0.000 . 8414258 .9486564 


الجوانب التوصيفية للانحدار - المُعَاملات و — تتطابق مع أو بدون 
الأخطاء المعيارية الموثوقة. ومن ناحية «e sl‏ فإن الأخطاء المعيارية 
الموثوقة نفسها مع فترات الثقة واختبارات ؛ Fy‏ تختلف عن نظيراتها غير 
الموثوقة التي رأيناها سابقا. وعموما فإن الاختلافات هنا هي اختلافات 
طفيفةء النتائج الرئيسة في هذا المثال لا تعتمد على افتراض أن الأخطاء 
مستقلة» وذات توزيع متطابق لكل القيم للمتغيرات التنبؤية. 
المنطق الذي تقوم عليه تقديرات الأخطاء المعيارية تم توضيحها في 
دليل المستخدم لبرنامج ستاتا User's. Gude‏ وباختصار نترك الهدف التقليدي 
وهو تقدير المعالم الصحيحة للمجتمع (B's)‏ لنموذج ما مثل: 
Yi = Bo + Bax: + €i l‏ 
وبدلاً من ذلك سوف نقوم بمحاولة تحقيق هدف متواضع وهو تقدير 
التباين من Aue‏ إلى Aue‏ التي قد يوجد في مُعاملات (p‏ فإذا قمنا بسحب 
عينات عشوائية وقمنا بتطبيق 01.5 بشكل متكرر لحساب قيم 5 لنموذج مثل: 
yi = ba + b,x, + e,‏ 
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-ل 003030300 الإحصاء مع برنامج ستانا 

نحن لا نفترض أن تقديرات 6 سوف تقترب من معلمة المجتمع 
الصحيحة وفترات الثقة تم إنشاؤها باستخدام الأخطاء المعيارية الموثوقة. 
وبالتالي نفتقد التفسير التقليدي عند الحصول على احتمال مؤكد (خلال 
المعاينة المتكررة) التي تحتوي على قيم B‏ الصحيحة يدلا من SALW‏ فإن 
فترات الثقة الموثوقة لها احتمال مؤكد DIS)‏ المعاينة — 
قيمة ib‏ والتي تُعرف بأنها القيمة التي بناءَ عليها تقوم العينة b‏ بتقد 
التقارب. ولذا فإننا نقلل من الاعتماد على فرضية أخطاء التوزيع O‏ 
من خلال قبول النتائج العادية. 

الخيار الآخر للتباين الموثوق هو vee(cluster clustervar)‏ الذي يسمح لنا 
بتقليص فرضية الأخطاء المستقلة إلى مستوى محدد وذلك عندما تكون 
الأخطاء مرتبطة مع مجموعات فرعية أو عنقودية من البيانات. فمثلاً في 
البيانات المقطعية رأينا اختلافات جوهرية في التباين بين الدول region‏ في 
المثال السابقء إضافة الخيار vee(cluster region)‏ تؤدي إلى الحصول على 
الأخطاء المعيارية الموثوقة في المجموعات الفرعية للدول region‏ 


.regress logco2 loggdpO urban0 urb gdp, 
vce(cluster region) 


Linear regression 


Number of obs - 175 
F( 3, 4) = 771.01 
Prob > F = 0.0000 
R-squared = 0.8670 
Root MSE = .27366 


(Std. Err. adjusted for 5 clusters in region) 






Robust 
Coef. Std. Err. t P>|t| 








logco2 [95$ Conf. Interval] 





loggdpO 
urbanO 












1.116759 





.0744462 .9100631 1.323454 

.0024787 .0015223 1.63 0.179 -.0017478 .0067052 
-.0082808 .0022161 -3.74 0.020 -.0144336 -.0021279 
.8950411 .0726082 12.33 0.000 .6934485 1.096634 


urb gdp 
_cons 





مرة أخرى CDs‏ الانحدار و8 متطابقة مع تلك التي كانت في 
النماذج السابقة» ولكن الأخطاء المعيارية وفترات الثقة واختبارات الفرضيات 


الفصل السابع : تحليل الانحدار الخطي 313 


تغيرت» الأخطاء المعيارية العنقودية أكبر بشكل ملحوظ من تلك التى كانت 
في النماذج السابقةء وهذا أدى إلى الحصول على إحصائيات 1 أصغر 
واحتمالات أعلى. استخدام الخيار vee(robust)‏ سابقا أدى إلى تغيرات طفيفة 
مشيرا إلى عدم وجود مشكلة معينة ومفترضا أن الأخطاء مستقلة ومتطابقة 
p.‏ زيع في المتغيرات التنبؤية بالنمو ذجء استخدام الخيار vee(cluster region)‏ 
أدى إلى تغيرات كبيرة» مشيرا إلى أن الأخطاء ليست مستقلة أو متطابقة 
التوزيع في المتغير region‏ وهذا ما كنا نعتقده. وبالتالي فإن تقديرات الخيار 
vee(cluster region)‏ معقولة؛ ويمكن الإفصاح عنها في مكان التقديرات 
الافتراضية إذا كنا نريد كتابة هذه النتائج في أي بحث. 


Predicted Values and Residuals : الفيم اطتوقعة والبواقي‎ 


بعد حساب أي انحدارء فإن الأمر predict‏ يمكنه الحصول ليس على 
القيم المتوقعة Ladd‏ وإنما Laf‏ على البواقي وإحصائيات حالات ما بعد 
التقدير» وهي الإحصائيات التي لها قيم منفصلة لكل مشاهدة في البيانات. في 
هذا ce jal‏ سوف ننتقل إلى مثال آخر حول الانحدار البسيط لجليد البحر في 
المناطق القطبية خلال شهر سبتمبر area‏ على السنة year‏ (باستخدام ملف 
البيانات .(Arctic9.dia‏ الانخفاض يميل ليكون في المتوسط 0.076- أو تقريبا 
0 كم” في Aid‏ وهذا يشرح نحو %75 من التباين في المنطقة 
القطبية area‏ خلال الفترة من 1979 إلى 2011. 
.use C:\data\Arctic9.dta, clear‏ 
-describe year area tempN‏ 





storage display value 
variable name type format label variable label 
year int Sty i Year 
area float %9.0g Sea ice area, million km^2 
tempN float %9.0g Annual air temp anomaly 64N-90N C` 


regress area year 
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Source Number of obs - 33 
F( 1, 31) = 99.55 

Model 17.4995305 1 17.4995305 Prob > F = 0.0000 
Residual 5.4491664 31 ..175779561 R-squared - 0.7626 
Adj R-squared = 0.7549 

22.9486969 32 .717146777 Root MSE - .41926 





P»|t| [95$ Conf. Interval] 






-.0764773 .0076648 -9.98 0.000 -.0921098 -.0608447 
157.4225 15.29154 10.29 0.000 126.2352 188.6098 


year 









يمكننا إنشاء متغير uta‏ باسم areahat‏ يحتوي على القيم المتوقعة من 
هذا الانحدار» ومتغير آخر باسم areares‏ يحتوي علئ بواقي ما بعد التقديرء 
وذلك باستخدام الأمر .predict‏ القيم المتوقعة لها نفس المتوسط الحسابي 
للمتغير الأصلي cy‏ والبواقي لها متوسط صفر = -1.38x10?‏ = 1.38609-)(0: 
لاحظ بأن استخدام علامة النجمة في الأمر summarize‏ أدناه يعني اس تخدام 
كل المتغيرات التي تبدأ باسم “area”‏ 


-predict areahat 

label variable areahat "Area predicted from 
year' . 

-predict areares, resid 

label variable areares "Residuals, area 
predicted from year' 

-Summarize area" 





Variable Obs Mean Std. Dev. Min Max 
area 33 4.850303 .8468452 3.09 6.02 
areahat 33 4.850303 .7395001 3.626667 6.073939 
areares 33 -1.38e-09 .4126578  -.8425758 1.116174 


القيم المتوقعة والبواقي يمكن تحليلها مثل أي متغيرات أخرىء. فمثلا 
يمكننا إجراء اختبار الاعتدال للبواقي للتأكد من فرضية الأخطاء الطبيعية؛ 
وفي هذا المثال اختبار الالتواء (sktest)‏ يوضح أن البواقي لا تختلف جوهريا 
عن التوزيع الطبيعي (0.45 = (p‏ 


-Sktest areares 
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Skewness/Kurtosis tests for Normality 





joint 
Variable Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob»chi2 





areares 33 0.2951 0.5344 1.59 0.4520‏ 
إنشاء رسم بياني للقيم المتوقعة مع السنة year‏ يوضح خط الانحدار 
(الشكل 9.7( 


-graph twoway connect area areahat year, 
msymbol(O +( 


2010 


——9—— Sea ice area, million km^2 —— ——1—— Area predicted from year 


1980 1990 2000 
Year 


الشكل )9.7( 


البواقي تتضمن معلومات عن المناطق التي يكون فيها النموذج ضعيفا 
وهذا يساعد في تشخيص وحل مشاكل التحليل. م هذا fog a8 C] alaall‏ 
بترتيب واختبار البواقي. البواقي السالبة تظهر aic‏ يقوم النموذج بإعطاء 
قيم أكبر للقيم المتوقعة» وهذا يحدث في سنواث معينة» حيث تكون المناطق 
الجليدية أقل من الاتجاه العام للتوقعات. ولبيان السنوات التي بها أقل من 


خمسة بواقي نقوم بطباعة الأمر: 
-Sort areares‏ 


list year area areahat areares in 1/5 
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year area areahat areares 


.932576 .8425758 
.856098 .6160985 
.691553 .4515528 
.626667 . 4266666 
.232689 .4226894 


OP س‎ t mn 





AD‏ من أقل خمسة بواقي حدثت في أحدث خمس سنوات» وهذا يشير 
إلى التقديرات المبالغ فيها حديثا. 
البواقي الموجبة تظهر عندما تكون القيم الفعلية أعلى من القيم المتوقعة. 
وحيث إن البيانات تم ترتيبها بواسطة e‏ ولعرض أعلى خمسة بواقي نقوم 
بإضافة محدد ”5-“ 5/1- in‏ هذا المحدد يعني خامس رقم من آخر مشاهدة 
وحرف "إل" (لاحظ أنه ليس رقم 1 وإنما حرف إل) هعني eaa Là a a‏ 
والمحددات 47/51 in -5/-1, in 47/1, in‏ كل منها يمكنه $i‏ بنفس الوظيفة. 
.list year area areahat areares in -5/1‏ 


year area areahat areares 
29. A -4.92678 6 
30. 5 .391439 .4685608 
31. : .162007 .4979923 
32. 5 .079735 .600265 


33. a .773826 1.116174 





مرة أخرى. هناك نمط معين؛ حيث إن أعلى بواقي موجبة أو السنوات 
التي يكون فيها النموذج الخطي أقل جليدا من الجليد الذي تم مشاهدته تمت 
خلال فترة التسعينيات وحتى بدايات 2000( وقبل الانتقال إلى تحليلات 
«c A‏ يُفترض أن نعيد ترتيب البيانات» وذلك عن طريق الأمر sort year‏ 
وبذلك تكون البيانات مرتبة حسب التسلسل الزمني 

الرسومات البيانية للبواقي مع القيم المتوقعة - والتي تسمى عادة الباقي 
مقابل المتناسب - تعتبر أداة تشخيصية مناسبة. الشكل )10.7( يوضح Jie‏ 
هذه الرسومات > حيث يوضح الشكل المتغير areares‏ مع المتغير areahat‏ مع 
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خط أفقي تم رسمه عند نقطة الصفر ومتوسط البواقي؛ لاحقاً في هذا الفصل 
في الشكل )17.7( يعرض طريقة أخرى لرسم مثل هذه الأشكال البيانية. 


.graph twoway scatter areares areahat, yline(0) 





Residuals, area predicted from year 





3.5 -4 


4.5 5 5.5 6 
Area predicted from year 


الشكل )10.7( 


الأشكال البيانية التي ترسم البواقي مع القيم المتوقعة لاتوضح أي ميول 
إطلاقء فهي مثل سرب من النحل الذي يكون أكثر كثافة في المنتصف (انظرٍ 
دراسة a Hamilton‏ 1992 للحصول على أمثلة أكثر). ولكن هناك ميولا مرائيا 
واضح في الشكل )10.7( حيث إن التوقعات مرتفعة جدا في السنوات الأولى» 
مما أدى إلى الحصول على بواقي أغلبها سالبة ومنخفضة في المنشصف»› ثم 
بواقي موجبة تميل لتكون مرتفعة lag‏ في نهاية dad‏ حيث تعود البواقي سالبة 
مرة أخرىء وهذا هو النمط الذي تمت ملاحظته سابقا عند ترتيب البواقي حسب 
حجمها. 

نمط الارتفاع والانخفاض في البواقي أصبح واضحاً في الشكل )11.7( 
٠‏ حيث إن البواقي مع القيم المتوقعة في الرسم البياني تم وضعهما مع بعضهما 
بواسطة منحنى منخفض. الانحدار يعتبر طريقة مفيدة لاكتشاف lai‏ التذبذدب 
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في ال البيانات. َم الحديث 0 عن ذلك في الفصل 3" (الشكل 26.3( 


graph twoway scatter areares areahat 
|] lowess areares areahat || , yline(0) 





4.5 5 
Area predicted from year 


© Residuals, area predicted from year 





lowess areares areahat 
(11.7) الشكل‎ 


هذا النمط غير الخطي في البواقي» يشير إلى أن النموذج الخطي لم يكن 
مناسبا لهذه البيانات - سوف نعود لهذه النقطة في الجزء القادم - كما اننا 
سنعود إليها مرة أخرى في الفصل (8). 

بعد أي تحليل انحدارء فإن برنامج ستاتا يحفظ المعاملات وتفاصيل أخرى 
بشكل «c a‏ ولذا فإن b[varname]‏ يشير إلى معامل Xia‏ مستقل varname‏ 
بینما b[ cons]‏ يشير إلى معامل cons‏ (عادة التقاطع مع المحور العمودي (y‏ 


.display _b[year] 
-.07647727 


-display _b[_cons] 
157.42247 


بالرغم من أن الأمر predict‏ يسهل عملية احتساب القيم المتوقعة 
والبواقي» فإنه من الممكن تعريف نفس المتغيرات من خلال زوج من أو امر 
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generate‏ باستخدام معاملات [ «bf‏ والمتغيرات الناتجة والتي تم تسميتها 
elit areres1  areahat!‏ لها نفس خصائص القيم المتوقعة والبواقي الناتجة 
من الأمر predict‏ ولكن لأغراض معينة. فإن الأمر generate‏ يعطلي 
المستخدمين مرونة أكثر. 

.generate areahat1 = b[ cons] + b[yearl*year 


.generate rearesi1 = area - areahatl1 
.summarize area* 








Variable Obs Mean Std. Dev. Min Max 
area 33 4.850303 .8468452 3.09 6.02 
areahat 33 4.850303 .7395001 3.626667 6.073939 
areares 33 -1.38e-09 .4126578 -.8425758 1.116174 
areahatl 33 4.850303 .7395001 3.626667 6.073939 


Other Case Statistics : 4) *-l حالات إحصائية‎ 


الأمر predict.‏ يمكنه حساب العديد من الإحصائيات الأخرى المناسبة 
للنماذج» وبعد الأمر regress‏ (أو (anova‏ الخيار predict‏ يتضمن التالي (سوف 
يتم التعويض عن أي aul‏ متغير جديد ب new‏ في هذه الأمثلة). 
predict new‏ القيم المتوقعة للمتغير predict new, xb cy‏ يعني نفس 
الشيء (الإشارة إلى «xb‏ قوة قيمة y‏ المتوقعة). 
predict new, resid‏ البواقى. 
predict new, rstandard‏ البواقي القياسية. 
predict new, rstudent‏ البواقي القياسية التي تقيس i‏ تأثير المشاهدة على 
تقاطع المحور العمودي y‏ 
predict new, stdp‏ الأخطاء المعيارية للمتوسط المتوقع y‏ 
predict new, staf‏ الأخطاء المعيارية لكل قيمة فردية متوقعة oy‏ بعض 
الأحيان تسمى الأخطاء المعيارية للتقدير أو 
الأخطاء المعيارية للتوقع. 
predict new, hat‏ العناصر المحورية لمصفوفة التقدير (كما أن الأمر 
leverage‏ يقوم بنفس الوظيفة). 
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a Ee t FH oss 
والذي يقاس بتائير‎ Cook's D تأثير مسافة كوك‎ predict new, cooksd 
J) في كل المعاملات التي في النموذج‎ i المشاهدة‎ 

بشكل مکافئ كل المشاهدات n‏ للقيم المتوقعة (y‏ 

هناك خيارات أكثر يمكنها الحصول على الاحتمالات المتوقعة والقيم 
المتوقعة. وللحصول على قائمة بهذه الخيارات قم بطباعة الأمر -help regress‏ 

لشرح هذه الخيارات»ء سوف نعود لبيانات الجليد بالقطب الشمالي بملف 
البيانات -Arctic9.dta‏ تحليل البو il‏ في الجزء السابق أشار إلى نموذج خطي 
في الشكل )9.7( وهو ليس مناسباً لهذه البيانات. أحد البدائل البسيطة 
الأخرىء» والذي يوصف بأنه الانحدار من الدرجة الثانية» وهو يتضمن تحليل 
انحدار المتغير التابع على «ممبرومربع «معبرء ويمكننا أن نبدأ ذلك بإنشاء 


year متغير جديد يساوي مربع‎ 
generate year2 = year^2 
.regress area year year2 






























Source Number of obs - 33 
F( 2, 30) = 67.73 

Model 18.7878137 2 9.39390686 Prob > F = 0.0000 
Residual 4.16088316 .138696105 R-squared = 0.8187 
- Adj R-squared = 0.8066 

22.9486969 .717146777 Root MSE = .37242 





P>|t| 





[95% Conf. Interval] 






9.658356 


















3.194155 3 0.005 3.135022 16.18169 
-.0024398 .0008005 -3.05 0.005 -.0040747 -.0008049 
-9552.853 3186.119 0.005 -16059.78 -3045.931 


year2 


R^,-0.8066 في تناسب‎ Lele luas 


الانحدار من الدرجة الثانية يعرض 
بالمقارنة مع 0.7549 للانحدار الخطي. وعلى كل حالء فإن التحسن هو 
تحسن ذو معنوية إحصائية» كما يشير إلى ذلك معامل المتغير 
-year(p=0.005)‏ الرسم البياني في الشكل (7 .12( يعرض هذا ES‏ 
والنموذج من الدرجة الثانية ليس مرتفعاً بشكل مستمرء حيث إنه أعلى ثم 
من الجليد المتوقعء كما حدث في النمودج الخطي السابق. 


.predict areahat2 
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label variable areahat2 "quadratic prediction 
.graph twoway connect area areahat2 year, 
msymbol(Oh d) 








1980 1990 2000 2010 
Year 


Sea ice area, million km^2  ——*—— quadratic prediction‏ جه 


الشكل )12.7( 


هناك بديلان للقيام بنفس الانحدار من الدرجة الثانيةء فبدون القيام بإنشاء, 


متغير جديد للجذر التربيعي لمتغير year‏ يمكننا استخدام الرمز التفاعلي 
ببرنامج ستاتا (#). الأوامر الثلاثة أدناه تقوم بتقدير نفس النموذج. سوف 
نحتاج للرمز # بعد الأمر margins‏ للقيام بالمهمة بالطريقة المطلوبة. 


.regress area year area2 
.regress area year c.yeardic.year 
.regress area c.year#itc.year 


بالرغم من التحسن الواضح في الشكل )12.7( فإن الانحدار من 
الدرجة الثانية يمكنه أن ينتج أو يزيد من نفس المشاكل الإحصائية» ومن 
الأمثلة على هذه المشاكل: القدرة على التأثير» والذي يعني التأثير المحتمل 
للمشاهدات التي بها قيم استذنائيةء والتي يمكن الحصول عليها باستخدام الأمر 

leverage aul في هذا المثالء قمنا بتسمية مقياس التأثير‎ - predict 
.predict leverage, hat 
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الشكل )13.7( يعرض منحنى الانحدار من الدرجة الثانية مرة أخرىء في 
هذه المرة الشكل يجعل رموز الربط تظهر متناسبة مع قوة التأثيرء وذلك بتحديد 
الأو زان التحليلية «[aw-leverage]‏ كما J‏ الشكل يضع منحنى متوسط (mspline)‏ 
يربط القيم المتوقعة 2/همءه. هذا المنحنى في العادة يُعد أفضل من الخط أو 
الخط المتصل لتوضيح العلاقات في الرسم البياني» لذا فهو يساعد في تحديد رقم 
أكبر للنطاقات في الرسم البياني. وللحصول على مزيد من المعلومات عن أنواع 
الرسم البياني twoway‏ قم بطباعة الأمر .help twoway mspline‏ 

graph twoway connect area year [aw-leverage], 
msymbol (Oh) 

|| mspline areahat2 year, bands(50) 
lwidth(medthick) 

|| ,note("Data points area proportional to 
leverage") 

legend(off) xline(1980 1996) 

x1abel(1980(5)2010, grid) 

xtitle("") 


ytitle("Sea ice area, million 
km(superscript:2)") 


2 


Sea ice area, million km 





1980 1985 1990 1995 2000 2005 2010 


Data points area proportional to leverage 


الشكل )13.7( 
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الرموز في الشكل (13.7) تكون أكبر حجما للسنة الأولى والسنة 
الأخيرة» GY‏ هذه السنوات لها تأثيرات أعلىء والانحدار من الدرجة الثانية 
يميل ليؤكد على أهمية قيم x‏ المتطرفة (حتى ولو Lind‏ بتربيع هذه القيم» فإنها 
تظل متطرفة) لذا فإن النموذج يحاول تتبع هذه القيم» لاحظ كيف أن المنحنى 
يتناسب مع السنة الأولى والسنة الأخيرة. 

القدرة على التأثير تعكس احتمالية التأثير. والإحصائيات الأخرى تقيس 
التأثير بشكل مباشر. af‏ إحصائيات هذا التأثير هو «DFBETAS‏ والتي تشير 

يقة ما إلى مُعاملات الأخطاء المعيارية للمتغير /× سوف تتغير إذا تم 
استبعاد المشاهدات : من تحليل الانحدار. يمكن القيام بذلك لمتغير تنبؤي 
واحد من خلال الأمر «predict new,dfbeta(xvarname)‏ قيم 5 لكل 
المتغيرات التنبؤية في النموذج يمكن الحصول عليها بسهولة عن طريق 
الأمر dfbeta‏ والذي يقوم بإنشاء متغير جديد لكل متغير تنبؤي. وفي مثالنا 
هناك متغيران تنبؤيان هما year, year2‏ وبالتالي فإن الأمر dfbeta‏ يعرف 
إحصائيات مؤثرة جديدة واحدة لكل متغير تنبؤي. 


.d£beta 
.describe _dfbeta* 
storage display value 
variable name type format label variable label 
.dfbeta 1 float %9.0g Dfbeta year 
.üfbeta 2 float %9.0g Dfbeta c.year#c.year 


. summarize  dfbeta* 





storage display value 
variable name type format label variable label 
-dfbeta 1 float %9.0g Dfbeta year 
_dfbeta_2 float 99 . و0‎ Dfbeta 2 


. summarize _dfbeta* 





Variable Obs Mean Std. Dev. Min Max 
_dfbeta_i 33 .0007181 .1702339 -.3360457 .550404 
_dfbeta_2 33 -.0007234 .1702921 -.550294 .3353676 


324 الإحصاء مع برنامج ستاتا 


رسم الصندوق في الشكل )14.7( يوضح توزيعات متغيرات 
5 مع aid‏ متطرفة تم تسميتها باسم year‏ 


.graph box  dfbeta*, marker(1, mlabel (year) ) 
marker (2, mlabel (year) ( 





EN Ofbeta year EEE Dieta year2 


الشكل )14.7( 


قيم المتغير /_66/0_ تقوم بقياس تأثير كل مشاهدة على معامل المتغير 
year‏ سنة 1996 (والتي تعرض قيمة مرتفعة في الشكل 13.7) وهي التي 
استحوذت على أغلب التأثير في معامل السنة year‏ قيمة المتغير 
dfbeta 1—0.55‏ 0.55 توضح ob‏ معامل المتغير year‏ في الانحدار للعينة 
بالكامل أن حوالي 0.55 من الأخطاء المعيارية أعلى من المفترض في حالة 
لو ما Lied‏ بإعادة تقدير النموذج مع استبعاد سنة 1996 . وبالمثل فإن القيم 
السالبة لسنة 1980 وهي dfbeta_1=-0.336‏ في معامل المتغير year‏ تشير 
إلى أن حوالي 0.336 من الأخطاء المعيارية أقل من المفترض في حالة لو 
ما قمنا بإعادة تقدير gigal‏ مع استبعاد سنة 1980 وبينما كان معامل year‏ 
أعلى من المفترّض في سنة 1996ء إلا أن معامل year?‏ أقل بمقدار مشابهء 
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والعكس قابل للتطبيق في سنة 1980؛ في البيانات الأصلية (الشكل 13.7) لم 
تكن سنة 1980 متطرفة ولكنها ذات تأثير أعلى مما dap‏ سنة 1980 أكشر 
1s‏ من السنوات الأخرى التي تأثيرها أقل. 

إذا لم نكن متأكدين من كيفية قراءة DFBETAS‏ يمكننا تأكيد تفسيرنا لهذه 
القيم من خلال إعادة تحليل الانحدار مع استبعاد القيم المؤثرة. ولتوفير 
مساحة» فإن الأمر quietly‏ هنا يقوم بالتأكيد على مخرجات الاتنحدار» 
ويعرض فقط مُعاملات المتغير year‏ والمتغير year2‏ وبينهما مسافات خالية 
حتى نتمكن من قراءتها بوضوح. تحليل الانحدار الأول يستخدم العينة 
بالكامل» بينما تحليل الانحدار الثاني يستبعد سنة 1996( والتي كان بها 
معامل المتغير year‏ أقل (من 8 إلى 8.067( ومعامل المتغير year?‏ 
أعلى (من 0.0024- إلى 70.0020(« إن عملية استبعاد سنة 1980 في 
تحليل الانحدار الثالث لها تأثير معاكس» حيث إن معامل المتغير year‏ أصبح 
(lel‏ (من 9.658 إلى 10.730( ومعامل المتغير year?‏ أصبح أقل (من 
4ه إلى 0.0027). 


. quietly regress area year year2 

. display. b[year] " " _b[year2] 

9.6583565 -.00243981 

.quietly regress area year year2 if year!=1996 
.display _b[year] " " _b[year2] 

8.0666424 -.00204096 

-quietly regress area year year2 if year!=1980 
.display _b[year] " " b[year2] 

10.730059 -.00270786 


إذا Ga‏ باستخدام # لإدخال شرط iuo à‏ فإن آخر od‏ سوف يكون 
كما يلي: : 


.quietly regress area year c.yeardic.year if 
year!-1980 


-display _blyear] " " _b[c.yeart#c.year] 
10.730059 -.00270786 

التأثير أو 2588745 أو أي إحصائيات أخرى يمكن استخدامها مباشرة 
لاسبتعاد مشاهدات من أي Tene‏ فمثلا أول أمرين من الأوامر أدناه تقوم 
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بحساب مسافة كوك Cook's D‏ وهي إحصائية تقو م بقياس تأثير كل مشاهدة 
على النموذج ككل بدلا من المُعاملات الفردية كما يحدث فى 2,0288145 
الأمر الثالث من الأوامر أدناه يكرر تحليل الانحدار الأولي باس تخدام 
المشاهدات التي ظهرت في مسافة كوك فقط وهي أقل من 0.10 

.regress area year © 2 


.predict D, cooksd . 
.regress area year year2 if D« .10 


POSEE أي تعريف ثابت عن سبب ظهور القيم المتطرفة‎ pem 
Asia CH cadi Mg] aene الممكن أن نرى الكثير منها في العينات الأكير‎ 
أحجام العينات أمر مرغوب فيه لتحديد المشاهدات الاستثنائية, وبعد تحديد‎ 
(هذا يتضمن تحديد المعامل‎ K نموذج الانحدار المناسب مع مُعاملات‎ 
على عدد المشاهدات ” يمكننا فحص هذه المشاهدات لمعرفة أي‎ sls الثابت).‎ 
من الشروط أدناه صحيح:‎ 

leverage h > 2K/n‏ التأثير 
Cook's D» 4/n‏ مسافة كوك 


DFITS»2 fs‏ المُعاملات المناسبة 


Welsch’s W»aVK 
DFBETA>2/ 4n 
ICOVRATIO - 1| > 3K/n 


سبب اختيار الحدودء وإحصائيات التشخيص eÍ‏ يمكن الحصول عليها 
من دراسات Cook and Weisberg(1982, 1980) Belsley, Kuh and‏ )1982 ,1994( 
Welsch‏ أو Fox‏ )1991(. 


: واحتلاف اللباين‎ sasibl تشخيص الارنباط‎ 
Diagnosing Multicollinearity and Heteroskedasticity 
مشكلة العلاقات الخطية القوية جدا بين‎ coll oats social bls YI 


المتغيرات التنبؤية E.‏ المتغير C‏ المستقلة في النموذج. إذا وجدت ERF‏ 
Masts‏ ايل بين المتغيرات التنبؤية» فإن معادلة الانحدار سوف تفتقر إلى 


الفصل السابع : تحليل الانحدار الخطي 327 


NM nl uev ي‎ ULL 
الحلول المطلوبة. برنامج ستاتا يحذرناء ثم يقوم باستبعاد المتغير التنبؤي‎ 
فإن‎ LAS وفي حالة وجود ارتباط متعدد مرتفع وليس‎ ٠ الذي يسبب المشكلة.‎ 
هذا يؤدي إلى مشاكل طفيفة جدا. . وإذا قمنا بإضافة متغير تنبؤي جديدله‎ 
علاقة قوية مع المتغيرات التنبؤية الموجودة مسبقا في النموذج» فإن ذلك‎ 
سوف يؤدي إلى ظهور أعراض لمشاكل أخرى منها ما يلي:‎ 

- أخطاء معيارية مرتفعة بشكل جوهري مع إحصائيات ؛ منخفضة. 

- تغير غير متوقع في مقدار المُعاملات أو إشاراتها. 

COLL -‏ غير جوهرية بالرغم من وجود R‏ مرتفعة. 

الانحدار المتعدد يحاول تقدير التأثيرات المستقلة لكل متغير yox‏ وهناك 
معلومات ALIS‏ للقيام بذلك إذا كان واحد أو أكثر من المتغيرات x‏ ليس لها 
تباين مستقل» الأعراض التي تم ذكرها أعلاه هي عبارة عن تحذير بأن 

تقديرات CoA‏ أصبحت غير (A ya‏ وربما تغيرت بشكل كبير مع 
تغييرات طفيفة في البيانات أو النموذج نفسه. هناك حاجة إلى المزيد من 
استكشاف الأخطاءء ومحاول تشخيصها لتحديد ما إذا كان الارتباط المتعدد 
مشكلة حقيقية. بس ادن 


مصفوفات الارتياط في العادة تعتبر كمؤشر تشخيصيء ولكن لها حدود 
معينة لاكتشاف الارتباط الخطي 5 الارتباطات يمكنها اكتشاف 
الارتباط الخطي أو العلاقات الخطية بين زوج من المتغيرات. ومن ناحية 
اخرى» فإن الارتباط المتعدد يتضمن علاقات خطية بين مجموعة من 
المتغيرات المستقلة» والتي قد لاتكون واضحة من الارتباطات. التشخيص 
المناسب يتوفر من خلال الأمر estat vif,‏ لتضخم التباين. 


.regress area year 2 





Source 

























MS Number of obs - 33 

F( 2, 30) = 67.73 

Model 18.7878137 2 6 prob > F = 0.0000 
Residual 4.16088316 30 .138696105 R-squared - 0.8187 
2 Adj R-squared = 0.8066 

22.9486969 32 .717146771 Root MSE = .37242 


















Coef. Std. Err. [95$ Conf. Interval] 

















9.658356 3.194155 3.135022 16.18169 
-.0024398 .0008005 -3.05 0.005 -.0040747 -.0008049 
-9552.853 3186.119 -16059.78 -3045.931 
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-estat vif 









220094.55 0.000005 
220094.55 0.000005 


Mean VIF | 220094.55 

العمود 1/715 في اليمين بالجدول أعلاهء يعطي La‏ تساوي ۸ - 1 من 
انحدار كل متغير × على المتغيرات الأخرى +. ففي مثالنا عن الجليد في 
القطب الشماليء تمثل حالة شاذة» حيث إن 0.000005 — وهي أقل من 
5 في المائة لتباين متغير year‏ هي مستقلة عن المتغير المستقل year2‏ 
والعكس. كما أن عامل تضخم التباين أو قيم VIF‏ نفسها مع المتغيرين 
التنبؤيين في النموذج يوضح أن التباين في مُعاملاتها أعلى من المفقرض 
بحوالي 220000 مر ob‏ الأخطاء المعيارية للمتغير year‏ في النموذج الخطي 
البسيط الذي رأيناه سابقاً في هذا Jail‏ تساوي 0.0076648 والخطأ 
المعياري المقابل في النموذج من الدرجة الثانية أعلاه أعلى بمرات عديدة من 
3.194155. 

ad‏ ۷1۴: تشير إلى وجود ارتباط خطي خطيرء وحيث إنه يوجد لدينا 
متغيران تنبؤيان في هذا call‏ فإننا نستطيع تأكيد ذلك من خلال النظر إلى 
الارتباطات. النتائج أدناه تظهر بأن المتغيرين year, year?‏ مرتبطان بشكل كامل. 


correlate area year year? 





(obs=33) 
area year year2 
area 1.0000 
year -0.8732 1.0000 
year2 -0.8737 1.0000 1.0000 


الارتبط الخطي أو الارتباط الخطي المتعددء يمكن أن يحدث في أي نوع 
من النماذج» ولكنهما أكثر انتشاراً في النماذج التي تكون فيها بعسض 
المتغير ات التنبؤية واضحة عن Ji «s AMI‏ نماذج التأثيرات التفاعلية أو 
تماذج الانحدار من الدرجة الثانية. الحل البسيط وهو التمركز- الذي تمت 
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الإشارة إليه سابقاً في شروط التفاعل - يمكنه Laf‏ أن يساعد في الانحدار 
من الدرجة الثانيةء لتقليل الارتباط الخطي المتعددء فإن التمركز في العادة هو 
«Jal‏ حيث ai}‏ ينتج معاملات أكثر دقة مع أخطاء معيارية منخفضة. 

يمكننا القيام بالتمركز من خلال طرح المتوسط من أحد متغيرات + قبل 
حساب الثاني» متوسط السنة year‏ في هذه البيانات هو 1995« والتمركز لهذا 
المتغير يسمى year‏ ويمثل السنوات قبل 1995 (سالب) أو ما بعد سنة 
5 (موجب). المتغير yearO‏ المتمركز له متوسط صفرء والمتغير الثاني 
الجديد year02‏ يساوي مربع yearÜ‏ وقيمه تتراوح ما بين 256 (عندما 
syear0=-16¢) 9S5‏ و هذا يعني 1979( إلى صفر (عندما 0 = yearü‏ وهذا يعني 
5 )ثم يعود من جديد ليكون 256 (عندما 16+ = lia 5 yearü‏ يعني 





.(2011 
.gen yearO = year - 1995 
gen year02 = year0 ^2 
.sSummarize year year0 year02 
Variable Obs Mean Std. Dev. - Min Max 
. year | 33 1995 9.66954 1979 2011 
year0 33 0 9.66954 -16 16 
year02 33 90.66567 82.23847 0 256 


بعد التمركز سوف تتضح لدينا الفروقات في معامل المتغير المتمركز 
والخطأ المعياري» ولمشاهدة هذا سوف نقوم بتحليل انحدار جليد البحر area‏ 
على المتغير year‏ والمتغير .year02‏ النتائج تشير إلى أن ۸ واختبار F‏ هي 
بالضبط نفس النتائج التي أظهرها تحليل انحدار area‏ على المتغيرات التي لم 
يتم إجراء تمركز لها وهي US year, year?‏ أن القسيم المتوقعة والبواقي 
استمرت كما هي. أما في نتائج المتغيرات المتمركزة فإن الأخطاء المعيارية 
للمتغير yearü‏ أقل بكثير» وفترات الثقة أصبخت أضيق» وإحصائيات ؛ أكبرء 
'وبواقي اختبار y‏ أصبحت ذات معنوية أكبر مما كانت عليه في تحليل 
الانحدار غير المتمركز مع متغير year‏ الأصلية. 


.regress area year0 year02 
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Number of obs 33 
























Source = 
F( 2, 30) = 67.73 
Model 18.7878137 2 9.39390686 Prob » F = 0.0000 
Residual 4.16088316 30 .1386961C5 R-squared = 0.8187 
Adj R-squared = 0.8066 
22.9486969 32 .717146777 Root MSE = .37242 














Coef. Std. Err. [95$ Conf. Interval] 



















-.0764773 .0068085 -11.23 0.000 -.0903821 -.0625725 
-.0024398 .0008005 -3 5 0.005 -.0040747 -.0008049 
5.071512 .0973195 52.11 0.000 4.872759 5.270265 










year02 


بالرغم من أن المتغير year‏ والمتغير Glas ye year?‏ بالكامل» فإن 
ارتباطهما بعد التمركز أصبح أقرب للصفر. 
.correlate year0 year02‏ 


(obs=33) 


year0 year02 





yearO 1.0000 
year02 -0.0000 1.0000 


ولأن المتغيرين التنبؤيين غير مرتبطين ولم يحدث هناك تضخم للتباين. 
.estat vif‏ 


Variable 








VIF 1/VIF 


x 
year0 1.00 1.000000 


1.000000 





كما أن الأمر esi estat‏ بحساب إحصائيات تشخيصية أخرى مفيدة 
estat hettest Stud‏ يقوم باختبار اختلاف التباين لافتراض تباين Lay‏ 
المستمرء حيث يقوم بذلك من خلال اختبار ما إذا كانت البواقي المعيارية 
المربعة ترتبط ارتباطاً Gha‏ بالقيم المتوقعة (انظر دراسة Cook and‏ 
Weisberg‏ 1994 لمزيد من الأمثلة والشرح). وكما هو موضح أدناه فإن الأمر 
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Y estat hettest‏ يعطي سببا لرفض فرضية العدم التي تقول بثبات التباينء 
حيث إن النتائج لاتوضح أن اختلاف التباين ذو معنوية إحصائية. 
.estat hottest‏ 
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity‏ 
Ho: Constant variance‏ 


Variables: fitted values of area 


chi2(1) = 0.00 
Prob > chi2 = 0.9802 


ومن ناحية أخرى» فإن وجود اختلاف تباين ذو معنوية إحصائية يعني 
أن الأخطاء المعيارية يمكن أن تكون متحيّزة» وبالتالي فإن نتائج اختبار 
الفرضيات تكون غير صالحة. ش 


نطاقات الثقة 3 ju V‏ البسيط : 


Confidence Bands in Simple Regression 


هذا الجزء يشرح بعض الرسومات البيانية الإضافية التي تساعد في 
العرض المرئي لنماذج الانحدار أو تشخيص المشاكل المحتملة» بالعودة إلى 
ملف البيانات cArctic9.dta‏ نجد أن المتغير tempN‏ يوضح متوسط القيم غير 
Ailaial el ggll $y) ya dq jal dy gall Agata‏ الشمالية ASM,‏ مق 64 إلى 
0 درجة شمالاً (من سجلات وكالة Lub‏ لدزجات حرارة الهواء وسطح 
البحر)ء القيم غير العادية في درجات الحرارة تمثل الاختلافات بالدرجات 
المئوية خلال الفترة من 1980-1951« القيم غير العادية Aum gall‏ هي قيم 
أعلى من متوسط درجات الحرارة خلال الفترة 1980-1951.. 

سبق لنا وأن رأينا هذه المناطق ومداها وحجمها في جليد المناطق 
الشمالية Lapai)‏ في شهن سيتمير) شهدت انخقاضا خلال الفترة 1979- 
1 وهي فترة المراقبة بالأقمار الصناعية. وليس مفاجتا بأن درجات 
حرارة هواء سطح البحر شهدت ارتفاعاً خلال نفس المدة بالرغم من أن هذا 
ليس السبب الوحيد في انخفاض الجليد. الميل في ارتفاع درجات الحرارة 
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يزداد بمقدار حوالي 8 درجة مئوية في السنة أو 8 في العقد (عشر 
سنوات)» وهو معدل أسرع من معدل الارتفاع العالمي ككل. وللمقارنةء فإن 
بيانات ناسا - لم يتم عرضها هنا - تشير إلى أن الميل في ارتفاع درجات 
الحرارة كان بمعدل 6 درجة مئوية خلال هذه السنوات. 


.regress tempN year 































Source Number of obs - 33 
F( 1. 31) - 51.64 

Model 10.2449886 1 10.2449886 Prob » F = 0.0000 
Residual 6.15050844 31 .198403498 R-squared 2 0.6249 
Adj R-squared = 0.6128 

16.395497 32 .512359282 Root MSE = .44543 

tempN Coef. Std. Err. t P»|t| {95% Conf. Interval] 
year .058516 .0081432 7.19 0.000 .C419079 .0751242 
_cons -115.9492 16.24582 -7.14 0.000 -149.0828 -82.81563 





الشكل )15.7( يوضح الميل نحو الارتفاع في القيم غير العادية لدرجات 
الحرارة في المنطقة القطبية الشماليةء درجات الحرارة الواقعية تم تمثيلها في 
الرسم البياني ووضعها على خط الانحدار مع فترة ثقة %95 للمتوسط 
الشرطي الذي تم تحديده بواسطة الأمر twoway Ifitei, stdp‏ الخيارات 
الأخرى تقوم بتحديد clas‏ خط الانحدار ليكون متوسط dall‏ ويكون عنوان 
الرسم مکتوبا بنص ذي حجم متوسط. كما تم استخدام رمز درجة مئوية وهو 
الرمز ASCII‏ رقم 186 تم إدراجه في عنوان المحور العمودي (انظر الشكل 

(ASCII في الفصل "3" لمعرفة الرموز الأخرى في‎ "16.3" 
.graph twoway lfitci tempN year, stdp 

lwidth(medthick) 


|| connect tempN year, msymbol(Th) 

|| , ytitle("Annual temperature 

anomaly, ` =char (186) 'C") 

legend (off) xlabel(1980(5)2010) yline(0) 
title("Arctic temperature trend with 95% c.i. 
for d 


conditional mean", size(medlarge) ) 


الفصل السابع : تحليل الانحدار الخطي 333 





Arctic temperature trend with 95% c.i. for conditional mean 


5 1 15 2 


Annual temperature anomaly,?C 
0 





N 
1980 1985 1990 1995 2000 2005 2010 
Year 
(15.7) الشكل‎ 


العديد من القيم الستوية تقع خارج فترات axi‏ في الشكل )15.7( مما 
يؤكد حقيقة أن هذه الفترات ند تشير إلى قيم المتوسط الشرطية أو الميل نفسه 
You‏ من Agi pill lad al‏ فلو افترضنا أننا نريد الحصول على توقع فردي 
لسنة 2012 وإيجاد فترة Ail‏ المناسبة لهذا التوقع» فإحدى الطرق للقيام بذلك 
هي استخدام محرر البيانات Data Editor‏ لإضافة 34 صفاً جديا من البيانات. 
وتحتوي هذه البيانات على قيم سنة 2012( أو يمكن القيام بذلك من خلال 
الأمرين أدناه: 
.set obs 34‏ 
.replace year - 2012 in 34‏ 


ثم قم بتكرار الانحدار M aed‏ على القيم المتوقعة» والأخطاء المعيارية 
للتوقعات (std)‏ القيم التي تقع أعلى .أو أدنى من حدود AGM‏ %95 هي القيم 
المتوقعة ن ius‏ ناقص أو زائد مر تين الخطأ المعياري للتو قعات: tempNhat‏ 


tempNse*2 33 5. ناقص أو‎ 
.predict tempNhat 
-label variable tempNhat "Predicted temperature’ 
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.predict tempNse, stdf 

.label variable tempNse "Standard error of 
forecast' 

.gen tempNlo = tempNhat - 2*tempNse 
.label variable tempNlo "lower confidence limit 
.gen tempNhi - tempNhat + 2*tempNse 
.label variable tempNhi "upper confidence limit 
.list year tempN* in -5/1 


year tempN tempNhat tempNse tempNlo tempNhi 
30. 1.551012 .4643515 .6223085 2.479715 
31. 1.609528 .4662754 .6769768 2.542078 


32. 1:668044 .468333 .7313777 2.60471 
33. 1.72656 .4705225 .7855148 2.667605 
34. 5 1.785076 .4728422 .8393915 2.73076 





يمكننا الآن إنشاء رسم بياني لقيم المتغيرات tempNlo‏ و tempNhi‏ في 
منطقة المدى (jo 55 )  (twoway rarea)‏ مدببة (rspike)‏ ورؤوس مدببة مغطاة 
(reap)‏ أو رسم بياني مشابه لعرض فترات الثقة» الشكل )16.7( يتبني نفس 
الطريقةء ويستخدم الأمر )2012 twoway Ifitci, stdf range(1979‏ ثم نقوم 
بوضع خط متصل (connect)‏ فوق رسم بباني لدرجات الحرارة التي تم 
رصدها خلال الفترة 1979 — 2011 Cus‏ تم تمثيلها Gl the:‏ مجوفة 
(msymbol(Th))‏ وشكل انتشار لدرجات الحرارة المتوقعة لسنة 2012 فقط 
مع علامة مربع (msymbol(S))‏ وتم إضافة نص يوضح القيم المتوقعة 
الرقمية» وحدود النقة rempNAat, tempNlo, tempNhi)‏ لسنة 2012 تم نسخها 
من الجدول أعلاه) ويجب ملاحظة أن حدود فترة الثقة stdf‏ ,ع6 ! واسعة le‏ 
فيه الكفاية لتكون بمستوى 9695 للمشاهدات؛ وليست مثل فترات الثقة التي 
كانت في الشكل )15.7( -Ifitstdp‏ 


graph twoway lfitci tempN year, stdf 
lwidth (medthick) 
range(1979 2012) 
enna tempN year, msymbol (Th) 
scatter t at year i == 
0 io empNh year if year--2012, 
|| , ytitle("Annual temperature a 
anomaly, ‘=char (186) 'c") 
legend (off) xlabel (1980(5)2010) yline(0) 
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text(2.8 2007 "2012 predicted temp" 

"1.79 (.84-2.73) ` =char (186) 'C") 

title ("Arctic temperature trend with 95% c.i. 
for predictions" 

, Size(medlarge)). 


Arctic temperature trend with 9596 c.i. for predictions 


2012 predicted temp 
1.79 (.84-2.73) °C = 


0 1 2 


Annual temperature anomaly ?C. 


-1 





1980 1985 1990 155 2000 2005 2010 
ER Year = 


الشكل )16.7( 


درجات الحرارة والمناطق المتجمدة والمتغيرات الأخرى من السلسلة 
الزمنية بملف البيانات Arctic9.dta‏ هي نوع من البيانات التي تنتج في العادة 
ار تباطاً autocorrelation Lala‏ أو ار تاطا Saha:‏ بين قيم البيانات المتوالية. 
إذا كانت أخطاء الانحدار في الواقع مزتيظة Lig‏ فإن: هذا يعني أن 
المعادلات العادية للأخطاء bed‏ ية وفترات الثقة واختبارات الفرضيات - 
والتي تم استخدامها في هذا الجزء من الكتاب - يمكن أن تكون مضللة. 
وبالتالي فإن الباحثين في مجال بيانات السلاسل الزمنية ونماذجها يقومون 
بشكل دوري بفحص الارتباط الذاتي الباقي» ويقومون بتطبيق طرق انحدار 
خاصة للسلاسل الزمنية عند الحاجة. 
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طرق انحدار السلاسل الزمنية (الفصل 12( تتطلب بيانات يجب 
اعتبارها بيانات خاصة بسلاسل زمنية باستخدام الأمر ctsset‏ هذا الأمر يحدد 
متغيرًا يستخدم كمؤشر للزمن. 
.tsset year‏ 
time variable: year, 1979 to 2012‏ 


delta:1 year 
الذاتي.‎ LL GY! هناك عدة طرق لفحص‎ tsset بالنسبة لبيانات الأمر‎ 
إحدى هذه الطرق معروفة ولكنها أقل تفصيلاء وهي اختبار دوربن واتسون‎ 
-Durbin-Watson 


-estat dwatson 
Durbin-Watson d-statistic( 2, 33) = 2.091689 


العديد من أدلة الاستخدام تحتوي على جداول للبحث عن اختبار دوربن 
واتسون» مع تقدير 33 مشاهدة ومعلمتين 2. فإن القيمة المحسوبة 2.09 تقع 
أعلى من 0.05-» وهي الحد الأعلى للجدول. لذلك فإننا لا نرفض فرضية 
العدم القائلة بأنه ليس هناك ارتباط ذاتي موجب من الدرجة الأولىء وهذا 
يعتبر أمرًا جيدًا لصلاحية الشكل (15.7) والشكل )16.7( ويعني أنه لايوجد 
تأكيد حول وجود الارتباط الذاتي عند استخدام فترات تباطؤ مثل سنتين أو 
ثلاث أو أربع سنوات ماضية. 

هناك طريقة أكثر تفصيلاً لحساب الارتباط الذاتي لحساب مُعَاملات 
الارتباط الذاتي للبواقي عند استخدام فترات تباطو مع اختبار التجميسع 
التراكمي أو إحصائية ليجنج بوكس كيو .Ljung-Box Q‏ هذا الاختبار يمكن 
القيام به من خلال تطبيق الأمر corrgram‏ على بواقي النموذج (والتي تسم 
تسميتها هنا -(tempNres‏ 


predict tempNres, resid 
-Corrgram tempNres 
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-1 0 1-1 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] (Partial Autocor] 
i -0.0803 -0.0826 .23248 0.6297 
2 -0.0920 -0.1081 .54749 0.7605 
3 -0.0494 -0.0746 .64146 0.8869 
4 -0.0249 -0.0461 .66619 0.9554 
5 0.2623 0.2818 3.5048 0.6227 
6 -0.1982 -0.2320 5.1858 0.5202 
7 0.1972 0.2678 6.9135 0.4379 
8 -0.0025 0.0217 6.9138 0.5460 
9 -0.1696 -0.2945 8.2974 0.5045 
10 0.1652 0.3323 9.6677 0.4701 
11 -0.2572 -0.5436 13.14 0.2843 
12 0.0647 -0.0919 13.37 0.3428 
13 -0.2205 -0.4464 16.177 0.2397 
14 0.0219 -0.0385 16.206 0.3009 


اختبارات © في جدول المخرجات cole}‏ ليست ذات معنوية عند فترات 
تباطؤ من 1 إلى 14 سنة ماضيةء لذا فإن الأمر corrgram‏ يتوافق بدرجة 
كبيرة مع نتائج الأمر estat dwatson‏ التي توضح بأنه ليس هناك ارتباط ذاتي 
Agee 93‏ إحصائية في Joa Clas Giga lly‏ في هذا لزه فان 
الاختبارات» وفترات الثقة لم يتم إخضاعها إلى أي اختبارات إضافية أخرى. 


Diagnostic Graphs : التنشخيصية‎ dul الرسومات‎ 


برنامج ستاتا يوفر العديد من الرسومات البيانية المفيدة بغرض تشخيص 
نتائج نماذج الانحدار. القليل من هذه الرسومات تم شرحها في هذا الجزء. 
للحصول على قائمة بهذه الرسومات قم بطباعة الأمر help regress‏ 
.postestimation‏ الأمثلة في هذا الجزء سوف تكون بمثابة تجربة على نموذج 
الجليد في القطب الشمالي الذي يُظهر Gh‏ منطقة الجليد في شهر سبتمبر تم 
توقعها للفترة من year‏ إلى year!‏ (بعد سنة year‏ تم إجراء تمركز) مع 
درجات الحرارة غير العادية السنوية .(tempN) el gell‏ بالنسبة لمتغير year‏ تم 
إجراء تمركز له (year0)‏ وتم تربيعه (yéar02)‏ وتم حساب هذه المتغيرات 
: سابقاً في هذا الفصلء ولكن تم إنشاء هذه المتغيرات من جديد بافتراض أنها 
غين مو ر دة g‏ لتر la DIS. Joa cd‏ كرح jas‏ .9682 من الاين 
في المنطقة الجليدية. 
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NOD. Jb ME p ——————‏ 
.use C:\data\Arctic9.dta, clear‏ 

.gen yearO = year - 1995 

.gen year02 = year0 ^2 

.regress area year0 year02 tempN 
























Source Number of obs - 33 
F( 3. 29) = 49.72 

Model 19.2134599 6.40448663 Prob » F = 0.0000 
Residual 3.735237 29 .128801276 R-squared = 0.8372 
Adj R-squared = 0.8204 

22.9486969 .717146777 Root MSE =  .35889 

















Coef. 





Std. Err. [95% Conf. Interval] 







yearO -.0601115 .0111399 -.0828951 -.0373279 


year02 -.0019336 .0008202 -2.36 0.025 -.0036111 -.0002562 
tempN -.2796799 .1538498 -1.82 0.079 -.594338 .0349783 
_cons 5.24665 1344514 39.02 0.000 4.971666 5.521634 





كما شاهدنا في الجزء السابقء فإن اختبار بواقي الارتباط الذاتي معقولء 
حيث إن اختبار 0 وجد أنه لايوجد ارتباط ذاتي ذو معنوية إحصائية عند 
استخدام فترة تباطؤ واحدة وحتى عشر فترات تباطؤ عند مقارنة بواقي كل 
سنةء ولكن الارتباط الذاتي يظهر عند استخدام فترات تباطؤ أكبر من 10 
ولكن هذا الارتباط الذاتي من غير المحتمل.أن يؤثر على النتائج. 


.predict areares2, resid 
-corrgram areares2, lag(10) 





-1 0 1 -1 0 1 
LAG AC PAC Q Prob>Q (Autocorrelation) [Partial Autocor] 
1 0.1140 0.1141 -46917 0.4934 
2 -0.1826 -0.2003 1.7112 0.4250 
3 -0.3273 -0.2968 5.8358 0.1199 
4 -0.0554 -0.0157 5.9581 0.2023 
5 0.0238 -0.1040 5.9816 0.3080 
6 -0.1620 -0.4049 7.1046 0.3113 
7 -0.1077 -0.1646 7.62 0.3673 
8 0.2332 0.3384 10.132 0.2559 
9 0.3583 0.2410 16.309 0.0607 
10 -0.0160 -0.2435 16.322 0.0908 


رسم بياني للبواقي مع القيم المناسبة يمكن إنشاؤه بواسطة حساب القسيم 
المتوقعة» وإنشاء رسم بياني للمتغير areares2‏ مع بقية 4 المتغيرات الأخرى. 
الطريقة الأسرع alll‏ بذلك تتم باستخدام erviplot jl‏ المثال في الشكل 
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)17.7( يُضيف Und‏ أفقيا لمستوى الصفر والمتوسط المتبقي» كما أنه يعطى 
وصفا لنقاط البيانات لكل سنة year‏ » كما أن الشكل يوضح dad Gh‏ متطرفة 
واحدة مع قيمة متبقية موجبة مرتفعة )1996( ولكن لا توجد إشارة واضحة 














عن وجود مشاكل. 
.rvfplot, yline(0) mlabel(year)‏ 
1996 € 
bi‏ 
1980 € $3065 
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Fitted values 


الشكل )17.7( 

الرسم البياني للقيم المضافة تعتبر أدوات Add‏ وتعرف بأسماء عديدة 
منها: رسم بياني لتأثير الانحدار الجزئي» أو رسم بياني للبواقي الجزئية 
المعدلة» أو رسم بياني للمتغيرات المعدلة. وهذه الرسومات البيانية Cava‏ 
العلاقة بين المتغير ر ومتغير × واحدء وهي تعديل لتأثيرات متغيرات x‏ 
الأخرى. وإذا كنا قد قمنا بحساب انحدار المتغير y‏ على المتغيرين x3‏ ,2+ أو 
بالمثل حساب انحدار المتغير x]‏ على المتغيرين x2, x3‏ ثم نأخذ البواقي من 
كل انحدار ونقوم بإنشاء رسم بياني لهذه البواقي. وسوف نقوم بإنشاء رسم 
بياني لمتغير إضافي يوضح العلاقة بين المتغير ر والمتغير 1× والمتغيرين 
المعدلين 3× «x2,‏ الأمر avplot‏ يقوم بالحسابات الضرورية بشكل تلقائي. فمثلا 
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اء oid thas qua)‏ داقن المت tempN (gl‏ هر olla DUE (je‏ 
الأمر: 
.avplot tempN‏ 
ولتسريع الحسابات أكثرء يمكننا القيام باستخدام الأمر avplots‏ للحصول 
غلل Cle pa jl Gye Ao gene‏ اة الصغررة لكل ip ph uita‏ في تايل 
«lass‏ الشكل )18.7( يعرض نتائج الانحدار للمتغير area‏ على المتغيرات 
year, year02, tempN‏ الخطوط المرسومة في أشكال المتغير الإضافي لها 
ميل يساوي مُعاملات الانحدار الجزئية المقابلة. فعلى سبيل المثال» ميل الخط 
عند أسفل اليسار في الشكل (18.7) يساوي 0.2797- وهو بالضبط معامل 
المتغير empr‏ للثلاثة متغيرات التنبؤية في تحليل الانحدار. 
.avplots‏ 


e(area| X) 
-5 0 5 


-1 





10 -100 


0 100 
e( year02 | X) 


0 5 0 
e( year0| X) 


e(area| X) 





0 5 
e( tempN| X) 
coef = - 27967986, se = 15384979. 1 = -1 82 


الشكل )18.7( 


الرسومات البيانية للمتغير الإضافي تساعد في تحديد المشاهدات التي لها 
تأثير غير متكافئ في نموذج الانحدار. أما في الانحدار المتعددء فإن إشارات 
التأثير تصبح أقل as‏ والمشاهدة التي بها مجموعة من القيم غير العادية في 
عدد من متغيرات + قد يكون تأثيرها مرتفعاً أو من المحتمل أن تؤثر على 
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الانحدار حتى ولو كانت إحدى قيم المتغير x‏ هي نفسها غير dale‏ 
المشاهدات ذات التأثير المرتفع تظهر في الرسم البياني للمتغير المضاف على 
شكل نقاط يمكن تمييزها عن باقي البيانات. وأغلب النقاط المتطرفة التي 
تظهر في الشكل )18.7( تظهر في مواقع ثابتة مع باقي البيانات الأخرى. 
إحدى القيم المتطرفة تظهر في الرسم البياني $ في أعلى اليمين في الشكل 
pty (18. 7)‏ إلى Alea) WEN E PIENE‏ أكثر سلبية) لمعامل 
المتغير cyear02‏ عندما نقوم بإنشاء رسم بياني لأحد المتغيرات المضافة 
باستخدام الأمر avplot‏ وتوصيف نقاط بيانات الرسم» فإن سنة 1996 تظهر 
أنها هي تلك القيمة المتطرفة. 
avplot year02, mlabel(year)‏ . 


€ 1996 


@ 2006 


€ 2004 
3 Lor 983 


e(area|X) 





0 
e( year02 | X ) 
coef = -.00193363, se = .00082017, t = -2.36 


الشكل )19.7( 


الرسومات البيانية للبواقي مضافاً إليها مكوناتها (والتي تم إنشاؤها 
بواسطة ^2 (cprplot‏ فإن المتحنئ يأخذ شكلاً مختلفا. فالرسم البياني 
للبواقي مضافاً إليها مكوناته للمتغير د يمثل Labs‏ كل باقي oss‏ إليه 
cAY Sa‏ فإن نموذج التنبؤ للمتغير x]‏ هو: 


eitb; xli 


مع قيم المتغير ord‏ مثل هذه الأشكال البيانية قد تساعد في تشخيص عدم 
Ahal‏ وتشير إلى نماذج عملية Aba‏ الرسم البياني الفعال للبواقي lila‏ 
إليها مكوناتها تعمل بطريقذ ما أفضل» ؛ بالرغم من أن كلا النوعين في العادة 
يعطيان نتائج غير حاسمة )1986 «(Mallows‏ الشكل )20.7( يعرض شكلا 
ER‏ أكبر للبواقي üt‏ إليها مكوناتها الناتجة من انحدار المتغير area‏ على 

.year0, year02, tempN المتغير ت‎ 
.acprplot tempN, lowess 


sidual 
5 


0 


Augmented component plus re 
-5 





5 1 1.5 
Annual air temp anomaly 64N-90N C 


الشكل )20.7( 


الخط المستقيم بالشكل )20.7( يتطابق مع نموذج الانحدارء Lais‏ = 
المنحني يعكس تجانس المربعات الصغرى الموزونة المحليةء والتي يمكن أن 
تعرض W‏ عدم الخطيّة أكثر. انخفاض المنحنى عند نهايته في الجانب الأيسر 
يمكن إهماله واعتباره مربعات صغرى موزونة اصطناعيةء حيث هناك 
حالات قليلة تحددٍ اتجاهات هذا المنحنى (انظر الفصل 8). إذا كانت هناك 
ol jal‏ مركزية أكثر في منحنى المربعات الصغرى الموزونة تعرض نمطا 
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منهجياً لانتقال المنحنى من نموذج الانحدار الخطي؛ فسوف يكون لدينا سبب 
للشك في كفاءة النموذج. في الشكل )20.7( قيم الوسيط للبواقي مضافاً إليها 
مكوناتها تتبع بشكل كبير نموذج الانحدار. الشكل يدعم النتائج التي تقول إن 
نموذج الانحدار الحالي يأخذ في الاعتبار عدم الخطية التي توجد في البيانات 
الخام ولا يترك أي بواقي. 

كما يبدو Last‏ أن الرسم البياني يعرض تربيع البواقي مقابل التأثير(الخط 
المائل لمصفوفة التقدير) مع تربيع cul gall‏ الشكل )21.7( يعرض مثل هذا النوع 
من الرسم لانحدار المتغير tarea‏ ولتحديد القيم المتطرفة الفردية سوف نقوم 
بتوصيف العلامات بالرسم البياني بالسنوات «ear‏ الخيار mlabsize(medsmall)‏ 
يحدد Gh‏ أسماء العلامات سوف تكون متوسطة الحجم» وهي بطريقة ما أكبر من 
الحجم الافتراضي وهو الحجم الصغير (للحصول على قائمة بالخيارات الأخرى 
لحجم النص» قم بطباعة الأمر «(help testsizestyle‏ الخيار mlabpos(11)‏ يضع 
هذه الأسماء عند موقع الساعة 11 بالنسبة لرموز العلامات. أغلب السنوات في 
الرسم البياني تظهر متشابكة في أسفل اليسار في الشكل (21.7) ولكن سنة 
6 تظهر متطرفة في الخارج مرة أخرى. 


.lvr2plot, mlabel(year) mlabsize(medsmall) 
mlabpos(11) 





a .15 
Normalized residual squared 


الشكل )21.7( 
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خطوط التأثير مع تربيع البواقي بالرسم البياني توضح متوسطات التأثير 
(الخط الأفقي)» وتربيع البواقي (الخط العمودي). التأثيريوضح احتمالية تأثير 
مشاهدة على الانحدار ly‏ على de gene‏ معينة من قيم المتغير ×. LÍ‏ قيم 
المتغير × المتطرفة أو المجموعات غير العادية فلها قيم تأثير مرتفعةء كما أن 
الارتفاع في تربيع البواقي يشير إلى أن مشاهدة ما مع قيمة للمتغير بر تختلف 
كثيراً عن القيمة المتوقعة بواسطة نموذج الانحدارء سنة 1996 لها أكبر 
تربيع للبواقي» وهذا يشير إلى أن النموذج أقل تناسباً مع تلك السنة» ولكن 
القيم المكونة للنموذج وهي المتغيرات year g tempN‏ تقع في المنتصف. 
وبالتالي فإن تأثير سنة 1996 أقل من المتوسط. — 
الرسومات البيانية التشخيصية والإحصائيات الأخرى تشير إلى 
المشاهدات المؤثرة أو المشاهدات التي يُحتمل أن يكون لها تأثير ولكن هذه 
الرسومات لا توضح ما إذا كان يجب علينا استبعاد هذه المشاهدات. هذا 
يتطلب I$‏ موضوعياً بناءَ على تقييم دقيق للبيانات» وتقييم للبحث بصفة 
عامة» وليس هناك تبرير موضوعي لاستبعاد سنة 1996 في مثال الجليد 
بالقطب الشماليء ولكن يُفترض - للتوضيخ فقط - أن نحاول إجراء ذلك 
على أي حال. وكما يُتوقع من التأثير المنخفض لسنة 1996 فإن إهمال هذه 
السنة يؤدي إلى اختلاف بسيط لنتائج تحليل انحدار sarea‏ مُعاملات المتغيران 
tempN‏ ,0«معبر تبقى تقريباً هي نفسها مع تأثير يصبح ذا معنوية إحصائية 
للمتغير Lal tempN‏ معامل المتغير year02‏ يصبح أقرب للصفرء ولكنه مازال 
سالباً وذا معنوية إحصائيةء R,‏ تزداد زيادة طفيفة من 0.82 إلى 0.85 عند 
استبعاد سنة 1996. في الحقيقة فإن هذه الاختلافات تعتبر طفيفة وليس لدينا 
سبب موضوعي لاستبعاد سنة 1996. النتائج توضح أنه من الأفضل الإبقاء 
على سنة 1996 في التحليل. 
-regress area year0 year02 tempN if year!=1996‏ 
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Source 55 df MS Number of obs - 32 

- F( 3, 28) = 61.62 

Model 18.9699037 3 6.32330125 Prob > F = 0.0000 
Residual 2. 6540433 28 .102287261 R-squared - 0.8688 
Adj R-squared = 0.8548 

Total 21.8339471 31 .704320873 Root MSE = .31982 














(95% Conf. Interval) 


year0 -.0602946 .0099275 -6.07 0.000 -.0806302 -.0399591 
year02 -.0015288 .0007439 -2.05 0.049 -.0030527 -4.87e-06 
tempN -.2820721 . 7 -2.06 0.049 -.5629203 -.0012239 


5.182538 .1218136 





4.933014 





5.432062 









در catal‏ كل من Cahmpers et al.‏ )1983( و Cook and Weisberg‏ )1994( 
تعطي أمثلة أكثر تفصيلا وشرحا للرسومات البيانية التشخيصيةء والطرق 
البيانية الأخرى لتحليل البيانات. 


yr dead! 
طرق الانحدار المتقدمة‎ 


Advanced Regression Methods 





اف NS C‏ ا ا لاتا بطر a‏ ات ال 
.(OLS)‏ ولأسباب عدة فإن OLS‏ إلى حد كبير تعتبر As)‏ طرق تحليل 
zal il Jas I‏ هذا الفصل يركز على مجموعة مختارة من طرق تحليل 
الانحدار الأخرىء والتي لها تطبيقات ciae‏ مع محاولة التركيز على 
التعقيدات التي لا as‏ في طريقة (OLS‏ وبالرغم من أن حساب الانحدار 
بالطرق الأخرى أكثر تركيزاً من OLS‏ بسبب كثرة التحديات الرياضيةء فإن 
هذه الطرق ليست صعبة الاستخدام ببرنامج ستاتا. 
ليس هناك تسلسل معين لشرح مثل هذا الموضوع المتنوع» ولكن كل 
جزء في هذا الفصل تمت تمت كتابته ليكون مستقلا بذاته» لذا فإن القارئ يمكنه 
الانتقال بين هذه الأجزاء دون الحاجة إلى قراءة الجزء السابق»ء وتم العمل 
على Jaa‏ الأمثلة في هذا الفصل بسيطةء مع الإشارة إلى المصادر الأخرى 
التي يمكن أن يجد فيها القارئ تفاصيل أكثر. 
مجموعة القوائم أدناه تغطي أغلب العمليات التي ت تمت مناقشتها في هذا 
الفصل» أحد هذه الموضوعات هو الانحدار غير ehil‏ والذي يتطلب 
استخدام أسلوب الأوامر بدلا من القوائم. | 
Graphics < Twoway graph (scatter, line etc.)‏ 
Statistics » Nonparametric analysis » Lowess smoothing‏ 
Statistics » Linear models and related » Other » Robust regression‏ 
Statistics » Linear models and related » Quantile regression‏ 


Statistics » Linear models and related < Box-Cox regression 
Statistics » SEM (Structural Equation Modeling) 
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Example Commands : عن الأوامر‎ alini 


.boxcox y x1 x2 x3, model (lhs) 
- يقوم بإيجاد أكبر التقديرات المتوقعة للمعلمة ۸ (لمدا) لتحويل كوكس‎ 
زائدأً أخطاء التباين‎ ×3, x2, x1 بوكس للمتغير بر وهي دالة خطية للمتغيرات‎ 
الثابت لجاوس. الخيار (50061055 يحدد التحويل للطرف الأيسر للمتغير س‎ 
وذلك‎ cx وهناك خيارات أخرى يمكن تحويلها للطرف الأيمن وهي متغيرات‎ 
للتحكم بشكل أكثر في تفاصيل نموذج الانحدار؛ للحصول على تفاصيل عن‎ 
كما‎ «help boxcox كيفية بناء الأمر أعلاه وقائمة بخياراته قم بطباعة الأمر‎ 
تفاصيل تقنية أكثر.‎ C يشر‎ Base Reference Manual المستخدم‎ JA iS 
-graph twoway mband y x, bands(10) || scatter y x 
على المتغير × مع خط‎ y يقوم بإنشاء رسم بياني لشكل انتشار المتغير‎ 
مع‎ (y يصل نقاط الوسيط ببعضها (نقاط وسيط المتغير »» وسيط المتغير‎ 
وهذا أحد أنواع نطاقات الانحدار:‎ las نقاط لكل‎ 10 elatus نطاقات أفقية‎ 
في هذا الأمرء فإن ذلك‎ mband بدلاً من الخيار‎ mspline وعند طباعة الخيار‎ 
LLG بكل‎ yay متحتي مائل‎ Ad الونيط بو‎ Ll سوف يودي إلى توصيل‎ 
من خط متصل بين كل نقطة وأخرى.‎ Yay 
-graph twoway 10688 y x,bwidth(.4) || scatter y x 
ويقوم‎ x يقوم بإنشاء رسم بياني لنقاط انتشار للمتغير رمع المتغير‎ 
بحساب المربعات الصغرى الموزونة المحلية باس تخدام‎ bwidth(4) الخيار‎ 
عرض قدره 0.4 )%40 من البيانات) وحتى يمكننا إنشاء قيم متجانسة‎ 
فإنه يجب استخدام الأوامر المتعلقة بالمربعات الصغرى‎ cans كمتغير‎ 
الموزونة (يتناولها المثال التالي).‎ 
-lowess y x, bwidth( 3) gen(newvar) 
يقوم بإنشاء رسم بياني للمربعات الصغرى الموزونة المتجانسة مع شكل‎ 
باستخدام نطاق سُمكه 0.3 )7630 من‎ x على المتغير‎ y انتشار المتغير‎ 
البيانات)» القيم المتوقعة لهذا المنحنى سوف يتم تخزينها في متغير جديد باسم‎ 
القيم المتوقعةء وهذا الخيار لا يمكن‎ Eis خيار‎ lowess Jo يوجد‎ newvar 
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القيام به باستخدام الأمر «graph twoway lowess‏ وللحصول على مزيد من 
التفاصيل e$‏ بطباعة الأمر .help lowess‏ | 
.nl (yi={b1=1}* {b2=1} 4x)‏ 
يقوم هذا الأمر باستخدام المربعات الصغرى غير الخطية المتعاقبة 
لتتناسب مع معلمتين في نموذج النمو bib? uA‏ والمعلمتان اللتان يتم 
تقديرهما هما bl‏ و62 محاطتان بالأقواس في الأمر أعلاه )0( مع بداية 
مقترحة la‏ بقيمة )1( وبدلا من AGS‏ النموذج في سطر الأمرء يمكننا توفير 
الوقت من خلال استخدام أحد أوامر النماذج المتوافرة في برنامج ستاتا أو 
كتابة برنامج جديد لتعريف نموذجنا الجديد. والمعلمتان الأسيّتان تحدثان 
لتكون واحدة من النماذج الأكثر Le gad‏ ويتم تعزيفهما بواسطة برنامج ستاتا 
cexp2 aul‏ وبالتالي فإنه بإمكاننا القيام بنفس المهمة التي قام بها الأمر أعلاه 
وذلك من خلال طباعة الأمر: 
)1 2ط 1 exp2: y x, init (b1‏ 21. 
بعد طباعة الأمر nl‏ قم باستخدام الأمر predict‏ لاستخراج القيم المتوقعة 
أو البواقي. 
b3 50)‏ 1. 2ط 25 enl log4: y x, init(b0 5 b1‏ 
الأمر أعلاه يتناسب مع 4 allen‏ لنموذج النمو اللوغاريتمي (logd)‏ ليكون 
على الشكل التالي: 
(((وط - exp(-5; (x‏ + 1)/ رط + y = bo‏ 
قم بتحديد القيم المعلمية الأولية لعملية التقدير المتعاقبة عند «b0-5‏ 
«b2 = 0.1 «b1=25‏ 50- 03؛ الخيار 1064 يشبه الخيار Cus cexp2‏ إنه أحد 
النماذج Gua quali yu Saige gall Ma] ut‏ ` 
.sem (y«- x1 x2 x3 x4) (x1<- x3 x4) (x2«- x3 x4)‏ 
هي نموذج لمعادلة هيكلية والتي يكون فيها x]‏ ,2× ,3× يؤثر على XL‏ ,بز 
2 وهي متغيرات متداخلة كل منها يتم التأثير عليها بواسطة x3, x4‏ 
erreg y x1 x2 x3‏ 
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يقوم بحساب الانحدار الموثوق للمتغير رمع ثلاثة متغيرات تنبؤية 
باستخدام المربعات الصغرى الموزونة التكرارية مع المعادلات الثنائية 
ومعادلات هوبر Huber‏ عند مستوى 9695 لكفاءة جاوس» بافتراض أن 
البيانات تم تجهيزها بطريقة مناسبة» فإن الأمر rreg‏ يمكنه Laj‏ حساب 
المتوسطات الموثوقة وفترات الثقة والاختلافات في اختبارات المتوسطات 
etal,‏ أو peal‏ 


.rreg y x1 x2 x3, nolog tune(6) genwt(rweight) 
iterate(10) 


يقوم بإجراء تحليل الانحدار si gall‏ 3( للمتغير .رمع ثلاثة متغيرات 
تنبؤية» الخيارات المعروضة أعلاه تطلب من برنامج ستاتا عدم طباعة سجل 
المحاولات. قم باستخدام ثابت ضبط مقداره 6 (والذي يقلل من القيم المتطرفة 
NOR ETE EET‏ الافتراضي 7(« ولإنشاء متغير (عشوائياً يسمى 
(rweight‏ يحتوي على الأوزان الموثوقة للتكرار النهائي إكل مشاهدة ويحدد 
الحد الأعلى للتكرار ليكون 10. 
-qreg y x1 x2 x3‏ 
يقوم بحساب الانحدار الربيعي» والذي-يُعرف كذلك باسم أقل قيمة مطلقة 
(LAV)‏ أو باسم الانحدار المعدل 11 للمتغير بر على ثلاثة متغيرات تنبؤية؛ 
والوضع الافتراضي أن نماذج الأمر qreg‏ تقوم بحساب الانحدار عند الربيع 
5 (الوسيط تقريباً) للمتغير ر كدالة خطيّة للمتغيرات التنبؤية:؛ وبالتالي 
يعطي الانحدار الوسيط. 
“Greg y x1 x2 x3, quantile(.25)‏ 
يقوم بحساب الانحدار الربيعي عند الربيع 0.25 (الربيع الأول) للمتغير 
y‏ كدالة Agha‏ للمتغيرات 1× X3, x2,‏ 


Lowess Smoothing : اطريعات الصغرى اطرجحة اطحلية‎ uil? 
av dux SE ا‎ Ladies لكف سه‎ 
اس سابقا في‎ e sd SE إلى تجانس‎ Cad 


DON الللمعلمي»‎ jussi uh d MENT les yall 
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طرق الانحدار اللامعلمية لا تحدد معادلة Ja‏ واضحة ولا تتطلب من 
التتخلرل Lacie‏ أن يحدد Glee SES‏ للعلاقة. وبدلا من ذلك فإن هذه اضرق 
تساعد على اكتشاف البيانات بطريقة أكثر وضوحا. هذا الإجراء يمكنه 
الكشف عن نتائج مثيرة أو غير متوقعة. 

الأمر lowess‏ و الأمر graph twoway lowess‏ يمكنهما إجراء التجانس 
(تجانس شكل الانتشار المرجح المحلي)» الأمر lowess‏ مع الخيار generate‏ 
يمكنه حفظ القيم المتوقعة. الأمر graph twoway lowess‏ يتميز بالبساطة 
ويتبع نفس التركيب المعتاد الذي سبق استخدامه في هذا الكتاب» وله إمكائية 
دمج أكثر من شكل بياني في شكل واحد كما حدث سابقاً في مجموعة أوامر 
graph twoway‏ وكمثال بسيط سوف نقوم بإجراء رسم بياني لدرجات 
الحرارة العالمية غير العادية باستخدام مجموعة البيانات بالملف global3.dta‏ 
والتي سبق استخدامها في الفصل (2). 


.use C:\data\global3.dta, clear 
.describe 


Contains data from C:MdataWMglobal3.dta | 


م 


obs: 1,584 Global climate 

vars: 5 4 Jul 2012 11:21 

size: 20,592 

storage display value 

variable name type format label variable label 
year int $8.0g Year 
month byte %8.0g Month 
edate int %tdmcy elapsed date 
temp float %9.0g NCDC global temp anomaly vs 1901-2000, C 
mei float $9.0g Multivariate ENSO Index 





Sorted by: year- month 


درجات الحرارة العالمية غير العادية في.الفترة من 1880 إلى 2011 
توضح تبايناً ملحوظاء من شهر AY‏ ومن سنة لأخرىء ومن المستحيل 
ملاحظة ما إذا كان التغير المناخي على المدى الطويل يتجه نحو ازدياد 
الحرارة أو البرودة أو سيبقى كما هوء تجانس المربعات الصغرى الموزونة 
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يساعد في ملاحظة التغير في المدى الطويل الذي يكمن في التقلبات الشهريةء 
الشكل (1.8) يعرض خظا Uis‏ لدرجات الحرارة والتواريخ الماضية 
(twoway line femp edate)‏ ثم يتم تركيب هذا الرسم على منحنى تجانس 
المربعات الصغرى المرجحة مع نطاق ced‏ 0.3 وخط أكثر سُمكا 
لتوضيحهة «(lowess temp edate, bw(.3) lwidth(thick))‏ وللحصول على 
معلومات عن الخيارات الأخرى للخطوط البيانية قم بطباعة الأمر help‏ 
-linewidthstyle‏ 


.graph twoway line temp edate 
|| lowess temp edate, bw(.3) lwidth(thick) 
|| , legend(position(11) ring(0) rows(2)) 








NCDC global temp anomaly vs 1901-2000, C 
~ lowess temp edate 


Jan1880 Jan1900 Jan1920 Jan1940 Jan1960 Jan1980 Jan2000 Jan2020 
elapsed date 


الشكل )1.8( 

منحنى lowess‏ في الشكل )8 .1( يعرض بوضوح مراحل ازدياد درجات 
الحرارة في فترة مبكرة من القرن العشرين Ga guns)‏ خلال الفترة 1920- 
1940( والانخفاض في درجات الحرارة في منتشصف القرن» والازدياد 
السريع في Ela‏ الحرارة (ما بعد سنة 1970( تتضمن نمطا مستمرا 
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للتغيرات في المناخ العالمي» نفس Jal yall‏ تظهر كذلك في البيانات المحلية 
في تواريخ ذوبان الجليد لبحيرة وينيب سودكي Lake Winnipesaukee‏ والذي 
يظهر في الشكل (26.3) في الفصل (3). 

55 يتوقع تجانس قيم المتغير «رلعدد 7 من المشاهدات الناتج من 
عدد من تحليلات الانحدار الموزونة on‏ بافتراض أن k‏ يمثل نصف النطاق 
مع التقريب إلى أقرب عدد صحيح. لكل متغير y,‏ قيمة متجانسة Sey?‏ 
الحصول عليها بواسطة الانحدار الموزون الذي يتضمن هذه المشاهدات 
الموجودة في المدى i=max(1,i-k)‏ وحتى Cus i = min (i+hn)‏ إن المشاهدة 
التي ترتيبها jth‏ في المدى المحدد لها وزن w,‏ وذلك حسب دالة ثلاثية 
التكعيب: 

wi = (l-l) 
حيث إن:‎ 
uj = (xi - ند‎ 

A‏ عبارة عن اختصار للمسافة بين ,× وأبعد قيمة في c Ls‏ الأوزان 
تساوي 1 لكل -: ولكن هذه الأوزان قد تنخفض إلى الصفر عند حدود 
الفترة» اننظر در اسة Chambers et al.‏ )1983( أو دراسة Cleveland‏ )1993( 
للحصول على تفاصيل وأمثلة عن طرق تجانس المربعات الصغرى المرجحة. 

خيارات الأمر lowess‏ تتضمن التالي: 


mean‏ وذلك لحساب المتوسط المتجانس» الوضع الافتراضي هو 

وضع خط تجانس المربعات الصغرى. 

4ع التجانس غير الموزونء والوضع الافتراضي هو حساب دالة 
كليفلاند Cleveland‏ الموزونة ثلاثية التكعيب. 

0 تحديد المدى للمجموعات الفرعية المتجانسة لمسدى من 
المشاهدات x n‏ التي تم استخدامها للتجانس - باستثناء نقاط 
النهاية التي تكون أصغر - وفترات عدم التأكد المستخدمة؛ 
الوضع الافتراضي هو bwidth(.8)‏ 
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logit‏ تحويل القيم المتجانسة إلى قيم لوغاريتمات. 
adjust‏ تعديلات المتوسط للقيم المتجانسة لتساري متوسط المتغير y‏ 
الأصلي مثل logit, adjust‏ وهي مفيدة.مع المتغير الثنائي y‏ 
 gen(mewvar)‏ إنشاء متغير جديد mewvar dau!‏ يحتوي على القيم المتجانسة 
للمتغير y‏ 
nograph‏ يمنع هذا الخيار عرض الرسم البياني ضمن النتائج. 


60 تتم إضافة رسومات بيانية أخر ى للرسم البياني الموجودء 
ولمزيد من التفاصيل قم بطباعة -help addplot option‏ 


0اا يؤثر على عرض خط التجانس» ولمزيد من التفاصيل قم 
بطباعة chelp cline options‏ وحيث إن هذا يتطلب ‏ من 
الانحدارات الموزونة لذلك فإن تجانس المربعات الصغرى 

المرجحة قد يستغرق Giy‏ عند حسابه للعينات الكبيرة. 
مثل طرق التجانس الأخرى (أو أي نموذج)» فإن تجانس المربعات 
الصغرى المرجحة يقوم بتقسيم البيانات: إلى أجزاء: جزء متجانس Jie‏ 
المنحنى السميك في الشكل )1.8( وجزء تقريبي وهو في اليسار بعد طرح 
التجانس من البيانات. وعادة فإن الجزء التقريبي يحتوي على معلومات مفيدة 
«Leal‏ ولشرح ذلك سوف تقوم بالانتقال إلى مجموعات بيانات عن طبقات 
الجو العليا خلال عدة قرون زمنية وهي تتضمن قياسات تم الحصول عليها 
من الطبقات الجليدية لجليد جرين (GISP2) asy‏ وهذه البيانات تم شرحها في 
در Mayewski, Holdsworth and colleagues 4l‏ )1993( ودراسة Mayewski,‏ 
Meeker and colleagues‏ )1993(‘ وقد قام الباحثان بالحصول على عينات من 
هذا الجليد وتحليلها كيميائياًء وهذه البيانات تمثل أكثر من 100,000 سنة من 
التغير المناخي « هذه البيانات موجو 33 بالملف Greenland. sulfate.dta.‏ 
وتتضمن Ib jan‏ بيطا من المعلومات عن تركيز الأصلاح الكبريكيسة 2795 

البحريةء ومؤشر عن كثافة التوزيع القطبية. 

.use C: Mata VGreenland sulfate.dta, clear 
-describe 
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Contains data from C:\data\Greenland_sulfate.dta 


obs: 271 Greenland ice core sulfate & PCI, 1500-1985 
(Mayewski 1993) 
vars: 3 2 Jul 2012 06:11 
size: 4,878 
storage display - value 

variable name type format label variable label 
year int try Year 
sulfate double %10.0g 504 ion concentration, ppb 
PCI double %6.0g ١ Polar Circulation Intensity 


Sorted by: year 


وللحصول على تفاصيل ASÍ‏ عن السلسلة الزمنية التي تحتوي على 
1 نقطةء يجب القيام بتجانس مع نطاق ضيق يُعادل 965 من العينة. الشكل 
)2.8( يعرض رسماأً Luly‏ لنتائج المتغير 46 وهو يمثل XS‏ الأملاح 


الكبريتية غير البحرية. 
¿graph twoway line sulfate year‏ 


lowess sulfate year, burden: 05) 
lwidth (medthick) 


IP ytitle("SO(subscript: 4} ion 
concentration, ppb") 


legend(label(1 "raw data") label(2 "lowess 
smoothed") 


position(11) ring(0) rows(2)) 


200 





raw data 
lowess smoothed 





SO, ion concentration, ppb 
100 150 


50 





1500 ` 1600 1700 1800 1900 2000 
Year 


الشكل )2.8( 
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الأملاح الكبريتية غير البحرية (SO,)‏ وصلت للمنطقة الجليدية بجرينلاند 
بعد أن تم إضافتها في طبقات الجو عن طريق البراكين أو الوقود المستخرج 
من الفحم والنفط. كلا المنحنيين (المتجانس والخام) بالشكل )2.8( يعطيان 
هذه المعلومات. المنحنى المتجانس يعرض تذبذباً بأعلى من المتوسط بقليل 
من 1500 وحتى بدايات سنوات 1800( Led‏ بعد 1900 فإن الوقود 
المستخرج قد دفع منحنى التجانس إلى الارتفاع مع انخفاض مؤقت بعد سنة 
9 (فترة الكساد العظيم) وبدايات السبعينيات (التأثير الناتج من القانون 
الأمريكي للهواء النظيف في سنة 61970 وحصار النفط العربي في سنة 
73 والارتفاع الكبير في أسعار النفط الذي صاحب حصار (hiill‏ أغلب 
الرؤوس المدببة في منحنى البيانات الخام تم تحديدها مع ثورات البراكين 
المعروفة مثل بركان هيكلا Hekla‏ في أيسلاند )1970( أو بركان كاتماي 
Katmai‏ في الاسكا (1912). 

بعد تجانس بيانات السلاسل الزمنية» فإنه من المفيد دراسة التجانس 
والتقريب (البواقي) للسلاسل بشكل منفصلء أدناه قمنا باستخدام الأمر lowess‏ 
لتحديد متغيرين جديدين: الأول للقيم المتجانسة للأملاح الكبريتية (smooth)‏ 
والثاني للبواقي أو القيم التقريبية (rough)‏ ويتم حسابها بطرح القيم المتجانسة 
من البيانات الخام. 


-lowess sulfate year, bwidth(.05) gen(smooth) 
-label variable smooth "SO4 ion concentration 
(smoothed)' 


-gen rough = sulfate - smooth 


.label variable rough "SO4 ion concentration 
(rough)' 


الشكل )3.8( يُقارن بين السلاسل الزمنية للمتغير smooth‏ والمتغير rough‏ 
في زوج من الرسومات البيانية التي تم وضع شروح لها باستخدام الخيارات 
«text()‏ لاحظ استخدام الخيار ات savingg)‏ في بداية أول أمرين لإنشاء الرسم 
البياني» هذان الشكلان تم وضعهما في شكل واحد باستخدام الأمر graph‏ 
«combine‏ في الكل الموحد تم استخدام محور أفقي واحد وتم وضع عنوان لهذا 
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المحور باستخدام bl bititle("Year")‏ في بداية الأمريشير أول عنوان في 
الال الشكل diua‏ لا ضرف على ged‏ مز والمخون: ترولكن ورت eb‏ 
العنوان أسفل الشكل b1)‏ و52)» وبالنسبة للعناوين في يسار الشكل )12511( 
والعناوين في أعلى الشكل d)‏ و2)) وفي يمين الشكل «r2 y rl)‏ في الشكل 
)3.8( عنوان المحور العمودي رتم إنشاؤه في بداية اليسسار وذلك باس تخدام 
الخيار .l1title("SO{subscript:4} ion concentration, ppb")‏ 


.graph twoway line smooth year,ylabel(0(50)150) 
xtitle("") 

lwidth (medthick) lcolor (maroon)ytitle("Smoothed") 
text(20 1540 "Renaissance") text(20 1900 
"Industrialization") 

text(90 1860 "Great Depression 1929") 
text(150 1935 "Oil Embargo 1973") 
saving(fig08 03a.gph, replace) 
.graph twoway line rough year, ylabel(0(50)150) 
xtitle("") 

ytitle("Rough") text(75 1630 "Awu 1640", 
orientation(vertical)) 

text(120 1770 "Laki 1783", 
orientation(vertical)) 

text(90 1805 "Tambora 1815", 
orientation(vertical)) 

text(65 1902 "Katmai 1912", 
orientation(vertical)) 

text(80 1960 "Hekla 1970", 
orientation(vertical)) 

yline(0) saving(fig08 03b.gph, replace) 
-graph combine fig08 03a.gph fig08 03b.gph, 
rows (2)bititle("Year") 

lititle("SO(subscript: :4) ion concentration, 
ppb") 
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يقوم الأمر regress‏ والأمر ER anova‏ انحدار المربعات الصغرى 
العادي (OLS)‏ القبول الكبير ل (OLS)‏ كان يرجع ا إلى مميزاته 
النظرية هذا في حالة الحصول على البيانات الصحيحة؛ وإذا كانت الأخطاء 
bo Gs de Vig‏ مسقل odia,‏ 5 يعتبر أكثر كفاءة من أي 
ge»‏ آخر غير متحيّز. الجانب الآخر من هذه العبارة هو إذا كانت الأخطاء 
غير موزعة توزيعاً طبيعياً مستقلاً ومحدذاء فإن المقدترات الأخرى غير 
المتحيّزة قد تكون أفضل من LOLS‏ وفي الحقيقة فإن كفاءة OLS‏ تنخفض 
بسرعة في مواجهة توزيعات خطأ ذات منحنى توزيع طبيعي ذو ذيل طويل 
(قيم متطرفة - ذات (ic y‏ مثل هذه التوزيعات مازالت موجودة بشكل كبير 
في العديد من المجالات والحقول العلمية. 


ue 
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تميل OLS‏ إلى تتبع القيم المتطرفة على حساب باقي القيم الموجودة 
بالعينة. وخلال المدى الطويلء فإن هذا يقود إلى تباين كبير من عينة إلى 
عينة أو عدم الكفاءة عند احتواء العينات على قيم متطرفةء لذا فإن الانحدار 
الموثوق يهدف إلى تعظيم كفاءة OLS‏ في Alle‏ وجود بيانات مثالية وزيادة 
هذه الكفاءة في الأوضاع المعقدة مثل وجود أخطاء غير طبيعية. الانحدار 
iis US ae ya cli atu (5 5 gall‏ لها ممرزانها Ga aes y‏ عند Sale‏ 
مع البيانات المعقدة. في هذا الجزء من الكتاب» سوف يتم شرح نوعين من 
الانحدار الموثوق هما qreg 5 rreg‏ وسوف تتم مقارنتهما مع .regress‏ 

لاحظنا في الفصل (7) الانخفاض الواضح والحاد في المنطقة المنخفضة 
لحجم الجليد في المناطق القطبية خلال الفترة 2011-1979 ولكن ماذا 
حول جليد البحر في المنطقة القطبية الجنوبية؟ النمط الجغرافي والفصلي 
للمنطقة القطبية الجنوبية يختلف عما هو عليه في المنطقة القطبية الشمالية. 
ففي وسط القطب الشمالي المحيط مُحاط باليابسة والتي أصبحت أكبر بعد 
الزيادة الكبيرة في ذوبان الجليد في السنوات الأخيرةء حيث إن اليابسة زادت 
مساحتها بأكثر من 3 ملايين كيلومتر مربع أو 4 ملايين كيلومتر مربع في 
المنطقة التي بها %15 على الأقل من الجليد خلال فصل الصيف» ومن 
ناحية أخرىء فإن المنطقة القطبية الجنوبية عبارة عن قطعة من اليابسة 
محاطة بالمحيطهء بينما جليد البحر في المنطقة القطبية الشمالية يمتد إلى 
القطب الشمالي إلا أن الجليد في القطب الجنوبي أقل امتدادا للقطب الجنوبي؛ 
ونسبة كبيرة من الجليد في المنطقة القطبية الجنوبية تذوب كل صيفء وعند 
بلوغ مستوى الحد الأدنى السنوي في شهر فبرايرء فإن الجليد في المنطقة 
القطبية الجنوبية ينخفض إلى نحو 2 مليون كيلومتر مربع» ويمتد إلى أقل من 
3 ملايين كيلومتر مربع؛ ملف البيانات Antarctic2.dta‏ يحتوي على بيانات 
عن متوسط امتداد الجليد خلال شهر فبراير (البيانات من دراسة Milke and‏ 
Heygster‏ 2009( وتغطي الفترة من 1972 إلى 2011 كما تتضمن البيانات 
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درجات الهواء السنوية غير العادية للمنطقة القطبية الجنوبيةء وهي تمتد من 
4 إلى 90 درجة جنوباء والتي تم تقديرها بواسطة وكالة ناسا. 


.describe 


Contains data from C:\data\Antarctic2.Jta 





obs: 39 Antarctic February mean sea ice 1973-2011 Milke 
& Heygster 2009 
vars: 4 2 Jul 2012 06:11 
size: 429 
storage display value 

variable name type format label variable label 
year int 58.09 Year 
yeargrp byte %9.0g dec 1972-1999 v. 2000-2011 
extents float 59.09 SH sea ice extent, million km^2 
temps float %9.0g Annual air temp anomaly 645-905 C 


Sorted by: year 


هل الحد الأدنى لامتداد ule‏ البحر في المنطقة القطبية الجنوبية يميل 
نحو الازدياد أو النقص؟. انحدار OLS‏ أوضح علاقة ضعيفة وليست ذات 
معنوية إحصائية لميله نحو التناقص (0.125 = (p‏ 


.regress extentS year 






Source 














Number of obs - 39 

F( 1, 37) = 2.46 

Model .480675664 1 .480675664 Prob » F = 0.1253 
Residual 7.22814772 37 .195355344 R-squared = 0.0624 
Adj R-squared = 0.0370 

7.70882338 38 .202863773 Root MSE = .44199 











extentS 





Coef. Std. Err. 


P»|t| [95$ Conf. Interval] 









-.0098642 .0062885 -1.57 0.125 -.022606 . 0028776 


-cons 22.84955 12.52695 1.82 0.076 -2.532471 48.23156 


تناقص درجات الحرارة في المنطقة القطبية الشمالية كان واضحا في 
الرسومات البيانية (الشكل 9.7 والشكل 12.7). الرسم البياني Qai ci‏ 
درجات الحرارة في المنطقة القطبية الجنوبية في الشكل )4.8( Y‏ يوضح 
اتجاهاً معيّناء حيث إننا لا نرى أي مشاكل إحصائية محتملة» القيم المرتفعة 
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للمتغير 5 في سنتي 1972 4 1977( هي فترة كانت فيها مشاهدات 
الأقمار الصناعية أقل وضوحاء وربما تؤثر هذه المشاهدات على خط 
الانحدارء وتسبب في Ala‏ السالب الضعيف. 


.predict exthati 

.label variable exthat1 "regress (OLS)' 

.graph twoway  connectextentS exthatl year, 
msymbol(O +( 


4.5 


3.5 


3 


2.5 


ا عا ال ا 
2010 2000 1990 1980 1970 
Year‏ 


—®— SH sea ice extent, million kn^2  ——1—— regress (OLS) 


الشكل )4.8( 


الانحدار الموثوق يقاوم تأثير القيم المتطرفة» مما يجعل الانحدار 
الموثوق يتناسب مع الفحص السريع لمعرفة ما إذا كانت القيم المتطرفة لها 
تأثير غير مناسب على نتائج «OLS‏ الأمر rreg‏ يقوم يبحساب د تحليل الانحدار 
الموثوق» وعند تطبيقه على ada‏ البحر للمنطقة القطبية الجنوبية اتضح بان 
هناك انخفاضا - ولكنه أقل حدة - وليس ذا معنوية. 


erreg extentS year 
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brem) cop di c dte ee ng E MNA AS‏ 


Huber iteration 1: maximum differente in weights - .61809736 
Huber iteration 2: maximum difference in weights - .1095464 
Huber iteration 3: maximum difference in weights = .0319613 
Biweight iteration 4: maximum difference in weights - .23592582 
Biweight iteration 5: maximum difference in weights = .08565176 
Biweight iteration 6: maximum difference in weights - .02170203 
Biweight iteration 7: maximum difference in weights - . 00318406 
Robust regression Number of obs - 39 
F( 1, 37) = 1.62 
Prob > F = 0.2105 








extents Coef. Std. Err. t P>|t| [95$ Conf. Interval] 










.0047588 
44.76544 


-.0208943 
-6.336321 


-.0080677 
19.21456 






-1.27 
1.52 






0.210 
0.136 










. 0063304 
12.61029 


بعد تطبيق الأمر rreg‏ يمكن للأمر predict‏ - بشكل عادي - الحصول 
على القيم المتوقعة. وتمثل هذه القيم المتوقعة بيانيا (والتي تسمى هنا 
2م الشكل )5.8( يقارن بيانيا بين خط OLS‏ وخط OLS‏ الموثوق. 


.predict exthat2 

.label variable exthat2 "rreg (robust)' 

.graph twoway connect extentS exthati1 exthat2 
year, 

msymbol(O + i) lwidth(medium medium thick) 
legend(ring(0) position(12) col(1)) 









n 

f 
—*——- SH sea ice extent. million km^2 

——+—_ regress (OLS) 

— (reg (robust) 





` 


35 


25 


1970 1980 1990 
Year 2000 2010 


, الشكل )5.8( 
الأمر »+ يعمل بواسطة المربعات الصغرى الموزونة التكرارية 
(IRLS)‏ التكرار الأول للأمر rreg‏ يبدأ مع «OLS‏ واي مشاهدات لها gu‏ 
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33 يي اس‎ ee 
أكبر من 1. فإن هذه المشاهدات‎ Cook's D كبير مثل أن قيم مسافة كوك لها‎ 
سوف يتم استبعادها تلقائيا بعد الخطوة الأولىء ثم بعد ذلك يتم حساب الأوزان‎ 
(وهذه الدالة تقلل المشاهدات‎ Huber function لكل مشاهدة باستخدام دالة هوبر‎ 
التي لها بواق كبيرة) ثم يتم حساب المربعات الصغرى الموزونة. بعد تك رار‎ 
حساب المربعات الصغرى الموزونة عدة مرات» فإن دالة الترجيح أو الوزن‎ 
T (تم الإشارة إلى هذا الوزن‎ Tukey سوف تنتقل إلى وزن توكي التنائي‎ 
ويتحول إلى توزيع جاوس بكفاءة %95. (لمزيد من‎ «(1985 Li دراسة‎ 
الأخطاء‎ n e 3b rreg الأمر‎ > «((19922) Hamilton التفاصيل انظر دراسة‎ 
المعيارية ويختبر الفرضيات مستخدماً طريقة قيم وهمية لا تعتمد على فرضية‎ 
.(1988 Street, Carroll and Ruppert التوزيع الطبيعي (انظر دراسة‎ 

الأمر rreg‏ والأمر Lod dS regress‏ ينتمي لمجموعة مُقدّرات M-‏ 
(احتمالية الحد الأقصى (maximum‏ البديل الإحصائي الاستراتيجي لهذين 
الأمرين يسمى تقدير L-‏ ويتناسب بشكل كبير مع ربيعات Yay‏ من توقعات 
أو متوسطات التقدير نفسه. فمثلا يمكننا إنشاء نموذج كيف أن الوسيط 
(الربيع 0.5) للمتغير ر يتغير مع المتغير ox‏ الأمر qreg‏ (وهو نوع من 
تقدير (L1-‏ يقوم بحساب الانحدار الربيعي» الأمر 8 يشبه الأمر Cus rreg‏ 
إنه يقاوم تأثير القيم المتطرفة. وعموماً فإن الأمر qreg‏ يميل ليكون أقل كفاءة 
أو به أخطاء معيارية مرتفعة مقارنة. مع الأمر rreg‏ وهذا هو الوضع هنا 
حيث إن الأمر qreg‏ وجد Parece‏ أخطاء معيارية أكبرء الشكل 
)6.8( يقارن بيانياً بين النماذج الخطيّة الثلاثة. 


.Qqreg extentS year 


Iteration 1: WLS sum of weighted deviations = 12.830409 


Iteration 1: sum of abs. weighted deviations = 14.282429 
Iteration 2: sum of abs. weighted deviations - 12.595795 


Iteration 3: sum of abs. weighted deviations 12.59334 

Median regression Number of obs - 39 
Raw sum of deviations 12. 99536 (about 3,0977242) 
Min sum of deviations 12.59334 Pseudo R2 = 0.0309 








extents Coef. Std. Err. t P>|t| {95% Conf. Interval] 






-.0056349 
14.29918 


.0054759 -1.03 0.310 -.0167301 .0054604 
10.9048 1.31 9..198 -7.796049 36.3944 
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.predict exthat3 

.label variable exthat3 "qreg (quantile)' 

.graph twoway connect extentS exthat? exthat2 exthat3 year, 
msymbol(O + i i) lwidth(medium medium thick medthick) 
lpattern(solid solid solid dash) legend(ring(0) position(12) col(1)) 
-Sgraph twoway connect extentS exthat? exthat2 exthat3 year, 
msymbol(O + i i) lwidth(medium medium thick medthick) 
lpattern(solid solid solid dash) legend(ring(0) position(12) col(1)) 
graph twoway connect extentS exthat! exthat2 exthat3 year, 
msymbol(O + i i) lwidth(medium medium thick medthick) 
lpattern(solid solid solid dash) legend(ring(0) position(12) col(1)) 
.graph twoway connect extentS exthat1 exthat2 
exthat3 year, 

msymbol(O + i i) lwidth(medium medium thick 
medthick) 

lpattern(solid solid solid dash) 

legend(ring(0) position(12) col(1)) 






n 
id له‎ SH sea ice extent, million km^2 
—+— regress (OLS) 

— Teg (robust) 


----- qreg (quantile) 







3.5 


A ts 


2.5 


1970 1980 1990 2000 2010 
Year 


الشكل )6.8( 


الوضع الافتراضي هو أن يقوم الأمر greg‏ بحساب الانحدار الوسيطء 
ولكن هناك قدرات عامة أخرى لهذا الأمرء حيث إن هذا الأمر له القدرة على 
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حساب النماذج الخطيّة GY‏ ربيع من ربيعات المتغير cy‏ وليس فقط الوسيط 
(الربيع 0.5). فمثلاً الأمر أدناه وجد أن الربيع الثالث (الربيع 0.75) للمتغير 
5ء انخفض بطريقة ما بشكل أكبر من انخفاض الوسيط خلال الفترة 
الزمنية. الميل للربيع 0.75 يساوي 0.0149- وهذا يعني انخفاضاً بمقدار 
0 كيلومتر مربع في السنة مقارنة مع 5,600 كم” في السنة للربيع 
5 أو الوسيط. وعموما فإن هذه النتائج ليست ذات معنوية إحصائية. 
-qreg extentS year, quant(.75)‏ 


Iteration 1: WLS sum of weighted deviations = 12.774128 

Iteration 1: sum of abs. weighted deviations = 12.877446 

Iteration 2: sum of abs. weighted deviations = 12.702146 

Iteration 3: sum of abs. weighted deviations - 12.323326 

Iteration 4: sum of abs. weighted deviations = 12.284196 

.75 Quantile regression Number of obs - 39 
Raw sum of deviations 12.70912 (about 3.4314537) 


Min sum of deviations 12.2842 Pseudo R2 = 0.0334 








extents Coef. Std. Err. t P»|t| _ [95% Conf. Interval] 














-.0149048 
33.15648 


.0179872 
35.83128 


-0.83 
0.93 


0.413 
0.361 


-.0513504 
-39.4446 


.0215408 
105.7576 














بافتراض ثبات تباين الخطأء فإن ميول خطوط الربيعات 0.25, 0.75 
يفترض أن تكون هي نفسهاء وبالتالي فإن الأمر greg‏ يمكنه فحص اختلاف 
التباين heteroskedasticity‏ أو أنو اع بسيطة من عدم الاعتدال. 

(ERE‏ للأمر «regress‏ فإن الأمر rreg‏ والأمر qreg‏ يمكنهما العمل مع 
المتغيرات المحولة (المحولة كلوغاريتمات أو ربيعات) والعمل مع أي عدد 
من المتغيرات التنبؤية Ley‏ في ذلك المتغيرات..الوهمية أو التفاعلات» الكفاءة 
وسهولة الاستخدام بشكل خاص تجعل الأمر rreg‏ ذا قيمة للقيام بفحص عام 
وسريع لمعرفة ما إذا كانت نتائج الأمر regress‏ تأثرت بالقيم المتطرفة أو 
أخطاء التوزيعات غير الطبيعية» وإذا تم تطبيق الأمر rreg‏ والأمر regress‏ 


306 الإحصاء مع برنامج ستاتا 


على نفس النموذج» سوف نحصل على نفس النتائج تقريباء ويمكننا تحديد 
استنتاجات بدرجة ثقة أكبر. إما إذا لم تتفق نتائج الأمر rreg‏ مع نتائج الأمر 
cregress‏ فإن ذلك يعتبر بمثابة علامة تنبيه بأن الاستنتاجات غير مستقرة: 
وتحتاج إلى مزيد من التحليل لمعرفة أسباب الاختلاف» وتحديد كيفية التعامل 
مع هذه المشاكل الإحصائية. 

الاختلافات بين نتائج الأوامر regress, rreg, qreg‏ ليست كبيرة في i‏ 
جليد البحر بالمنطقة القطبية الجنوبية. نتائج الأوامر الثلاثة جميعها تتفق 
هناك علاقة ضعيفة وليست ذات Aya‏ إحصائية نلميل نحو الانخفاض. KE‏ 
regress‏ يعطي ميلا أقل حدة في هذا الاتجاهء وذلك بسبب تأثره بالسنوات 
الأولى التي كانت قيمها مرتفعة. لهذا السبب فإن نماذج الأمر rreg‏ أو الأمر 
qreg‏ قد تكون مفضتلة عن غيرهاء ولكن يمكننا السؤال عما إذا كان نموذج 
خط معقول في بداية التحليل» انحدار تجانس المربعات الصغرى المرجحة 
والذي لا يفترض أي شكل عملي محدد يُعتبر أداة للإجابة عن الأسئلة من 
هذا النوع. عند تطبيق انحدار التجانس على بيانات جليد البحر بالمنطقة 
القطبية الشمالية (النتائج لن يتم عرضها (Ua‏ فإن انحدار التجانس أظهر 
منحنى متشابهاً Gus‏ لذلك الذي أنتجه النموذج الربيعي في الفصل السابق 
بالشكل )12.7( Ld‏ تطبيقه على جليد البحر بالمنطقة القطبية الجنوبية في 
الشكل (7.8) التالي فإن النتائج شير إلى أنه لاشيء يتشابه مع النموذج 
الخطي أو النموذج الربيعي Yu,‏ من ذلك فإن الانحدار المتجانس يعطي 
lag‏ نوعياً للانخفاض الأولي والارتفاع الذي عقب ذلك ثم الانخفاض في 
السنوات الأخيرة. الانخفاض الأولي هو الوحيد الذي و Quai, d jus‏ 
ذلك هو وجود القدرة المحدودة للأقمار الصناعية في تسجيل التغيرات في 
تلك الفترةء وربما قد يكون نمط التغير في المدى الطويل سوف يكون أكثر 
ا في السنوات القادمة» ولكن aad Ma‏ ليل eal y‏ ميق البيانتات 
الموجودة لدينا. 


-graph twoway connect extentS year n lowess 
extentS year 
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2.5 
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Year 





—e— SH sea ice extent, million km^2 lowess extentS year 


الشكل )7.8( 


: qreg والأمر‎ rreg yo تطبيقات أخرى‎ 


Further rreg and qreg Applications 


الجزء السابق»ء عرض تطبيقات مبستطة للأمر rreg‏ والأمر .qreg‏ هذه 
الأوامر يمكن استخدامها Leal‏ بعدة طرق من الطرق السهلة إلى الطرق 
الأكثر تعقيدأ. فمثلاً للحصول على فترة ثقة %90 لمتوسط متغير واحد مثل 
درجة حرارة el sell‏ في المنطقة القطبية الجنوبية (remp)‏ يمكننا طباعة أمر 

.ci فترة الثقة‎ 
.ci tempS, level(90) 


Variable Obs Mean Std. Err. [90$ Conf. Interval] 
temps 39 3351282 .065531 .2246459 .4456105 

, أو بدلا من ذلك» يمكننا coded‏ على نفس «dau giall‏ وفترة ull‏ من 
خلال تحليل انحدار بدون إدخال متغيرات ox‏ الخيار nohead‏ يمنع ظهور 


جدول الانحدار حيث ليس له حاجة هنا. 


.regress tempS, nohead level(90) 
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[90$ Conf. Interval] 


-3351282 .065531 5.11 0.000 .2246459 4456105 


وبالمتل» يمكننا الحصول على lau gia‏ موثوق مع فترة هة 9690« 


الخيار nolog‏ يمنع ظهور dau‏ التكرار الموثوق وذلك توفيرا للمساحة. 
.rreg tempS, nolog level(90)‏ 


Robust regression Number of obs 


F( 0 38) 
Prob > F 


39 
0.00 











Coef. Std. Err. t P»|t| [90$ Conf. Interval] 












.318898 .0707103 4.51 0.000 .1996837 .4381124 





الأمر :qreg‏ : يمكن استخدامه بنفس الطريقة للحصول على فترات ثقفة 
تقريبية لوسيط أو أكثرء مع ملاحظة أن الربيع 0.5 الذي تم تم الحصول عليه 
عن طريق الأمر qreg‏ قد لايكون عبار با الوط aod En os‏ 0.5 
والوسيط متساويان. وعملياً فإن ley I‏ هي قيم تقريبية من القيم الحقيقية 
للعينة» حيث إن الوسيط يتم حسابه عن طريق .مساب متوسط القيمت-ين 
المركزيتين في البيانات في حالة أن مجموعة فرعية تحنوي على عدد زوجي 
من المشاهدات. لذا فإن وسيط العينة والربيع 0.5 يمكن أن يكونا مختلفين 

بطريقة لا تؤثر كثيراً على تفسير النموذج. 
-qreg tempS, nolog level(90)‏ 


Raw sum of deviations 12.63 (about .28) 
Min sum of deviations 12.63 


Number of obs - 39 


Pseudo R2 3 0.0000 










Coef. Std. Err. t P»|t| 


(90% Conf. Interval) 
_cons 







075718 3.70 0. 501 .1523428 .4076572 


والربيع 0.5 يساوي fo e‏ ل 
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شهدت ارتفاعا في درجات الحرارةء مما أدى إلى زيادة قيمة المتوسط. في 
الأوامر أعلاهء الخيار 160610 يحدد ذرجة الثقة المرغوبة؛ وإذا قمنا بإهمال 
هذا c joa‏ فإن ستاتا يقوم تلقائيا بحساب فترة ثقة 9695 

ولمقارنة المتوسطين يقوم المحللون باستخدام اختبار + للعينتين (ttes)‏ أو 
تحليل التباين في اتجاه واحد oneway)‏ أو .(anova‏ وكما شاهدنا سابقأء يمكننا 
حساب اختبارات التعادل (وتؤدي إلى الحصول على إحصائية F‏ وإحصائية (t‏ 
وذلك من خلال تحليل انحدار المتغير الرقمي على متغير وهمي: المتغير 
الوهمي yeargrp‏ والذي يساوي 0 للفترة 1999-1972 ويساوي 1 للفقرة 
2011-2000 يقدم تفسيراً لذلك. الشكل )8 8( يعرض lass Uit‏ الحرلرة 


Que غير العادية لهاتين المجمو‎ 
.graph box tempS, over(yeargrp) 


5 1 1.5 


Annual air temp anomaly 64S-90S C 
0 ١ 





1972-9 2000-2011 


الشكل )78.8 


تحليل الانحدار يؤكد الانطباع الذي حصلنا عليه من الشكل )8.8( Cus‏ 
إن السنوات الأخيرة شهدت casei a ILS ja ui sss lel J‏ 
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ج ج ی pot ee c6 ML ERN‏ 
الارتفاع ذو معنوية إحصائية )0.026 = «p‏ متوسط درجات الحرارة غير 
العادية في المنطقة القطبية الجنوبية يساوي 0.239 درجة مئوية للفترة 
LÍ (1999-1992‏ للفترة 2011-2000 فإن المتوسط أعلى — 0.312 
درجة مئوية )0.239 + 0.312 = 0.551 درجة مئوية)» وتجدر الملاحظة 
أنه حتى مع ارتفاع درجات الحرارة نصف درجة مئويةء فإن المنطقة القطبية 
الجنوبية مازالت مكاناً باردا جداً. ودرجات الحرارة سوف تستمر تحت 

الصفر لسئوات حول منطقة القطب الجنوبي 


.regress tempS yeargrp, nohead 







Coef. Std. Err. t P»|t| 





[95$ Conf. Interval] 





yeargrp 
_cons 


.3115741 .1344639 2.32 0.026 .0391244 .5840237 
.2392593 .0745871 3.21 0.003 .0881314 .3903871 





ولكن» هل يمكننا الثقة v3‏ هذه النتيجة؟ الأمر rreg‏ أوضح d‏ 
المتوسطات الموثوقة ASÍ‏ اختلافاً بقيمة قدرها 0.329 درجة مئويةء هذا 
الاختلاف ذو معنوية إحصائية )0.023 = (p‏ 

.rreg tempS yeargrp,. 2019 


Robust regression 


Number of obs - 39 
F( 1, 37) = 5.60 
Prob » F = 0.0233 















tempS Coef. Std. Err. ^ t P» |t] (95% Conf. Interval] 








yeargrp 
-cons 









. 5 .1330096 2.37 0.023 .0473602 .6106807 
-2155861 .0771087 2.80 0.008 .0593511 .3718251 





الأمر qreg‏ وجد أن الربيع 0.5 يختلف أيضاء حيث إنه يساوي 0.38 
درجة مئوية. هذا الاختلاف ليس ذا معنوية إحصائية )0.082 = «(p‏ وحيث إن 
هذه الاختلافات ليست ذات معنوية إحصائية بسبب زيادة الأخطاء المعيارية 
في تحليل الانحدار الذي تم بالأمر greg‏ فإن هذا يؤدي إلى انخفاض 
إحصائية e‏ أن زيادة ess YI‏ المعيارية تعكس انخفاض كفاءة الأمر -qreg.‏ 

-qreg tempS yeargrp, nolog gu 
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Median regression Number of obs - 39 
Raw sum of deviations 12.63 (about .28) 
Min sum of deviations 11.54 Pseudo R2 = 0.0863 







temps Coef. Std. Err. t P>|t| (95% Conf. Interval] 


.38 .137707 2.76 0.009 .1009791 .6590209 
.19 .079176 2.40 0.022 .0295742 .3504257 





yeargrp 
cons 











مع تأثير الترميزء وشروط التفاعل المناسبةء يمكن للأمر regress‏ تكرار 
تحليل ANOVA‏ بالضبط. حيث إن استخدام الأمر regress‏ مع اتباعه بأوامر 
الاختبار المناسبة» سوف نحصل على نفس نتائج ۸ واختبار F‏ والتي يمكن 
الحصول ale‏ باستخدام الأمر anova‏ القيم المتوقعة التي يتم الحصول 
lide‏ من وش ii Breet a CPR coat‏ سات المجموعة. و تكسن 
للأمر el js) rreg‏ تحليلات متمالة لاختبار الاختلافات في المتوسطات 
4a ji gall‏ بذلا من 'المتوسطات العاذية: (Bary‏ استخذام الأمر qreg‏ ينس 
النمط للحصول على احتمال ثالث لاختبار الاختلافات في قيم الوسيط. كل 
هذا يتيح لنا صياغة-نماذج متشابهة مع تحليل التباين المتعدد N-way ANOVA‏ 
أو التغاير ANCOVA‏ مع تضمن الربيع 0.5 أو تقدير قيم التباين بدلاً من 
المتوسطات المعتادة. 

بغض النظر عن شكل توزيع الخطأء فإن OLS‏ تظل مقدّرًا غير متحيّزء 
وفي الأمد الطويلء فإن تقديرات OLS‏ يُفترض أن تتمركز في قيم معلمية 
صحيحة. هذه الحالة لا تنطبق على أغلب المقدّرات الموثوقةء وإذا لم تكن 
الأخطاء متماظةء فإن خط الوسيط الذي تم إنشاؤه بالأمر qreg‏ أو الخط ثنائي 
الوزن الذي تم إنشاؤه بواسطة الأمر rreg‏ نظرياً تتزامن مع خط y‏ المتوقع 
والذي تم تقديره بواسطة الأمر sregress‏ وطالما أن التواء الأخطاء يعكس 
جزءًا صغير! من توزيعهاء فإن الأمر rreg‏ قد يكون أقل تحيّزا. ولكن عندما 
يكون الالتواء في التوزيع بالكاملء فإن الأمر rreg‏ سؤف يقلل وزن جانب 
واحد من النموذج؛ مما يؤدي إلى تقديرات تقاطع-ر متحيزة بشكل ملحوظ. 
تقديرات ميل الأمر rreg‏ تظل غير متحيزة بالرغم من الالتواء في توزيعات 
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الأخطاء الملتوية. نحن نخاطر بالوقوع في تقديرات متحيزة لتقاطع y-‏ ولكن 
يمكن توقع تقديرات دقيقة و غير متحيزة لمُعَاملات الانحدار الأخرى. في 
العديد من التطبيقات مثل المُعَاملات هي أكثر إثارة للاهتمام إلى حد كبير من 
تقاطع y-‏ مما يجعل المفاضلة Myo)‏ مفيدًا جدا. وعموما فإن اختبارات F‏ و, 
ليست مثل OLS‏ فهي لا تفترض وجود الأخطاء الطبيعية. 


Nonlinear Regression — 1 : 1 — غير الحطى‎ jus 


تحويل المتغيرات يسمح بإنشاء بعض العلاقات غير الخطية باس تخدام 
تقنيات مألوفة للنماذج الخطية الحقيقية. ومن ناحية أخرىء فإن النماذج 
الخطية الحقيقية تتطلب مستوى آخر من التقنيات المتناسبة. الأمر 1ه يقوم 
بحساب الانحدار غير E‏ بواسطة المربعات الصغرى المتعاقبة. هذا 
الجزء يشرح مع الأمثلة التوضيحية للبياءات الموجودة بالملف snonlin.dta‏ 


-use C:\data\nonlin. dea; clear 
.describe 


Contains data from C:\data\nonlin.dta 








obs: 100 Nonlinear model examples (artificial data) 
vars: 5 2 Jul 2012 06:11 

size: 1,700 

storage display value > 

variable name type format label variable label 
x byte — $9.0g Independent variable 
yl float %9.0g yl = 10 * 1l.0Yyx*e 
yz float 39.0g y2 = 10 * (1 - .95*x) +e 
yi float 859.09 yl = 5 + 25/(1l+exp(-.1*(x-50))) + e 
y4 float $9.0g y4 = 5 + 25*exp(-exp(-.1*(x-50))) + e 





Sorted by: x 


بيانات الملف nonlin.dta‏ تم إنشاؤها مع متغيرات ر والتي تعرف Ji ga‏ 
غير خطيّة متنوعة للمتغير + زائدا أخطاء جاوس العشو ائيةء فمثلا المتغير اير 
يمثل عملية النمو cent)‏ 

yl 210 x 1.03* 0 
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تقدير هذه المعلمات من البيانات يمكن الحصول عليها باستخدام الأمر nl‏ 
yl = 11.20 x 1.03*‏ 

وهو قريب بدرجة كبيرة من النموذج الصحيح. 

.nl (y1 = (b1-1)*(b2-1)^x) 


(obs - 100) 

Iteracion 0: residual 
Iteration 1l: residual 
Iteration 2: residual 
Iteration 3: residua? 
Iteration 4: residual 
Iteration 5: residual 
Iteration 6: residual 
Iteration 7: residual 
Iteration 8: residual 
Iteration 9: residual 






Source 


Model 
Residual 

















Ss 


SS 
SS 
SS 
SS 
SS 
SS 
SS 
SS 
SS 
SS 


667018.255 
26138.2933 


693156.549 


= 419135.4 
= 416152.4 
= 409107.7 
= 348535.9 


= 31488. 
= 27649. 
= 26139. 
= . 26138. 
= 26138. 
= 26138. 


df 


2 
98 











46 
49 
18 
29 
29 
29 


333509.128 
266.717278 


100 6931.56549 


yl Coef. Std. Err. 
/b1 11.20416 1.146683 
/b2 1.028838 .0012404 












Number of obs - 100 

R-squared 3 0.9623 

Adj R-squared = 0.9615 

Root MSE = 16.33148 

Res. dev. = 840.3864 

t P>|t| [95% Conf. Interval] 
9.77 0.000 8.928602 13.47971 
829.41 0.000 1.026376 1.031299 


الأمر predict‏ يقوم بحساب القيم المتوقعة والبواقي للنموذج غير الخطي 
الذي تم تقديره باستخدام الأمر nl‏ الشكل )9.8( يعرض رسما بيانيا للقيم 
المتوقعة من المثال السابق» موضحا التناسب الأقرب ما بين النموذج 


.predict yhati 


.(R^—0.96) والبيانات‎ 


-graph twoway scatter y1 x. 

|| line yhati x, sort 
| , legend(off) ytitle("y1 = 10 * 1.03^x 
+ e)xtitle("x') 
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100 150 200 


10*1.03^x* e 


yi 
50 





الشكل )9.8( 


بدلاً من كتابة نموذج الأمر enl‏ يمكننا الحصول de‏ نفس النتائج 
بطباعة الأمر التالي: 
exp2: yl x‏ 21. 
الخيار exp2‏ في الأمر أعلاه يقوم باستخدام برنامج اسمه nlexp2.ado‏ 
والذي يُعرّف Alla‏ النمو LY‏ ذات معلمتين. برنامج ستاتا يتضمن العديد من 
تلك البرامج لتطبيق الدوال التالية: ` 
exp3‏ ثلاث معلمات tial‏ ترطرطجمقدبر 
2 معلمتان أسيّتان: y= bb?‏ 
2 معلمتان أسيّتان سالبتان )"55 - 1),ط=ر 
4 أربع معلمات منطقيّة» by‏ تمثل مستوى البداية و(,50+8) مقاربا للحد 
الأعلى الذي يساوي (((رط-ت)رط-)مع«ء+1)/رط+مطحر 


3 ثلاث معلمات منطقية lai‏ من الصفر b;‏ تقارب للحد الأعلى 
y-bi(VYrexp(-bi-b;)))‏ 
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4 أربع معلمات لجومبرتز Jii by «Gompertz‏ مستوى البداية 
(bytbi) 5‏ عقارب dal}‏ الأعلى y=botb,/exp(-exp(-b2(x-63)))‏ 
gom3 ٠‏ ثلاث معلمات لجومبرتز Gompertz.‏ تبدأ من الصفر by‏ تقارب 
للحد الأعلى y=byexp(-exp(-bx(x-bs)))‏ 
يمكن للمستخدمين AUS‏ برامج nlfunction u$ AÍ‏ خاصة بهم» كما يمكنك 
استخدام nlgom4.ado, nlexp3.ado‏ أو الأمثلة الأخر ی أعلاه. وللحصول على 
تفاصيل وشروحات عن كيفية تحديد وتقدير النماذج قم بطباعة الأمر !م shelp‏ 


Nonlinear Regression — 2 : 2 — غير الخطى‎ just 


بيانات adsl‏ لشهر سبتمبر في المنطقة القطبية الشمالية (Arctic9.dta)‏ 
تعطي مثالا حقيقيا. في الأمثلة السابقةء رأينا أن منطقة جليد البحر انخفضت 

في الفترة 2011-1979 وهي الفترة القريبة من مشاهدات الأقمار الصناعية. 
الرسومات البيانية التشخيصية توضح نموذجاً las‏ مناسباً ولكن بشكل سيء 
وذلك بسبب أن الانخفاض كان أسرع من الوضع الخطي (الشكل 9.7 
والشكل 11.7( النموذج الآخر للمنطقة القطبية الجنوبية أفضل ويشرح اتجاه 
المشاهدات خلال سنة 2011 (الشكل 12.7(« إذا تم توقع النموذج الربيعي 
gal‏ اكا قليلة (ada‏ فإن اتجاهه يكون مستحيلاً فعلياء حيث إنه سوف يصل 
للصفر بسرعة كبيرة» ويستمر ليكون سالبا. النماذج الفعلية تميل لإظهار 
انخفاض تدريجي حتى يصل هذا الانخفاض إلى الصفر (على سبيل المثالء 
انظر دراسة Wang and Overland‏ 2009). النظير البسيط لمثل هذه النماذج 
الفعلية قد تكون منحنى S-‏ تماثلي» وهذا المنحنى Sie‏ جومبرتز Gompertz‏ 
بدلاً من الانخفاض السريع في النموذج الربيعي. 

الأوامر أدناه تعمل على نموذج جومبرتز ثلاثي المعلمات لجليد البحر 
فى المنطقة القطبية الشمالية. سوف نركز على المتغير extent‏ (المناطق التي 
بها جليد نسبته %15 على الأقل) Ya‏ من المتغير area‏ (المناطق التي بها 
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جليد 70100( والذي تم استخدامه سابقاء وكما رأينا سابقاً في الشكل )14.3( 
فإن المتغيرين يسلكان نفس السلوك. 


.uge C:\data\Arctic9.dta, clear 
.nl gom3: extent year, nolog 


{obs = 33) 








Source 


















Number of obs = 33 

Model 1425.43798 475.145994 R-squared = 0.9957 
Residual 6.15941312 . 205313771 Adj R-squared = 0.9953 
Root MSE = .4531156 

1431.5974 43.3817393 Res. dev. = 38.25858 





3-parameter Gompertz function, extent = bl*exp(-exp(-b2* (year - b3))) 






extent Coef. Std. Err. t P>|t] [95$ Conf. Interval) 







7.580278 -291652 25.99 0.000 6.984645 8.175911 
-.0995915 .0271646 -3.67 0.001 -.155069 -.044114 
2017.531 2.173212 928.36 0.000 2013.093 2021.969 


























/b2 





نموذج جومبرتز مناسب بشكل كبيرء. حيث إن الثلاث معلمات ذات 
معنوية إحصائية» المعلمة الأولى .177.58 تعطي نقطة بداية تقريبية للنموذج 
وهي 7.58 مليون كم”. المعلمة الثانية b2=-0.0996‏ تتحكم في التغير في 
معدل الانخفاض. المعلمة الثالثة b3=2017.5‏ تعطي نقطة انقلاب التي عندها 
ينتقل المنحنى من الارتفاع Jans)‏ انخفاض مرتفع) إلى محدب لأعلى (معدل 
انخفاض ضعيف) خلال سنة 2017. لتمثيل هذا النموذج بيانياً الشكل 
(10.8) يعرض القيم المتوقعة» والتي تم توصيلها بواسطة منحنى وسيط 


(منحنى التجانس). 
.predict gomext1‏ 
-graph twoway connect extent year‏ 
mspline gomext1 year, band (50)‏ | | 
lwidth (medthick) ,‏ 


legend(label(1 "Observed extent") 
label(2 "Gompertz prediction')) ~~ 
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$$$ 
1980 1990 2000 2010 
: Year 





—*— Observed extent Gompertz prediction 


الشكل )10.8( 


منحنى جومبرتز في الشكل )10.8( لا يبدو مختلفا عن المنحنى الربيعي 
(لم يتم عرصه (Lia‏ ويتناسب بدرجة بسيطة» كما تنقصه زيادة طفيفة وغير 
واقعية في المنحنى الربيعي خلال s cul cd guai‏ عفوسا Min cj nu‏ 
اختلافات جوهرية تظهر عند استقراء نتائج منحنى جومبرتز خارج نطاق 
البيانات. 
وإذا افترضنا أننا نفكر في إضافة بيانات جديدة في التحليل ليشمل الفترة 
حتى سنة 2030 - البيانات des Gu edd‏ حتى سنة 2011 - فإننا نبدأ 
بإضافة 19 مشاهدة إضافية لاتحتوي على بيانات الجليدء ولكن تحتوي على 
قيم السنة الجديدة فقط Aiu year‏ 2012 وحتى سنة 2030. الأمر الأول في 
الأوامر أدناه يحدد عدد المشاهدات وهو 52 (والذي كان 33( الأمر الثاني 
يحسب year e‏ وهي تساوي السنة الماضية زائداً 1 لكل مشاهدة لاتوجد بها 
قيمة للسنة» وأخيرا نقوم بإعادة تقدير نموذج.جومبرتز مع السنوات الجديدة 
وسوف نحصل على نفس النتائج الثي حصلنا عليها سابقا. 
-set obs 52‏ 
replace year = year[ n-1]«1 if year--.‏ 


.Sort year 
.nl gom3: extent year, nolog 
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iobs = 33) 







Source 

















Number of obs - 33 

Model 1425.43798 3 475.145994 R-squared 5 0.9957 
Residual 6.15941312 30 .205313771 Adj R-squared - 0.9953 
: Root MSE = .4531156 

1431.5974 33 43.3817393 Res. dev. = 38.25858 





3-parameter Gompertz function, extent = bl"exp (-exp(-b2" (year - b3))) 





[95% Conf. 








Interval] 






7.580278 . 2 25.99 0.000 6.984645 8.175911 
-.0995915 .0271646 -3.67 0.001 -.155069 -.044114 
2017.531 2.173212 928.36 0.000 2013.093 2021.969 






















/b2 





بالرغم من أن بيانات الجليدء وتركيبة النموذج لم تتغيرء فإن البيانات 

الجديدة امتدت لتشمل سنوات إضافيةء مما يسهل عملية الحصول على قيم 
متوقعة لكل السنوات من 1979 وحتى 2030. 

.predict 2خ‎ 1 

بخلاف القيم المتوقعة» فإن البواقي للمتغير extent‏ يتم حسابها للسنوات 

-predict res, resid 

.Summarize res 


Variable Obs Mean Std. Dev. Min Max 


res 33 .0000746 .4387273 -1.039796 1.137713 


الأوامر أدناه تستخدم القيم المتوقعة الجديدة (gomext2)‏ مع الانحراف 

المعياري للبواقي. الخيار r(sd)‏ (تم تعريف النتائج بواسطة الأمر 

(summarize‏ يُستخدم لتحديد الحدود العليا والدنيا لفترات الثقة 254+ حول 

القيم المتوقعة. ثم بعد ذلك نقوم بإنشاء رسم بياني يعرض منحنى جومبرتز 
فترة الممتدة حتى 2030 مع التأكيد على التوقع الخاص بسنة 2012. 

-gen gomlo - gomext2 -2*r(sd) 

-gen gomhi = gomext2 «2*r(sd) 


-label variable gomext2 "nl gom3: extent year’ 
-label variable gomlo "Gompertz extent - 2sd' 
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.label variable gomlo "Gompertz extent + 2sd 
-graph twoway rarea gomlo gomhi year if year< 
2012, color (gs13) 
|| mspline gomext2 year if year< 2012, 
bands (60) 
lwidth (thick) lcolor (maroon) 
E mspline gue year if year»- 2012, 
bands (60) 
lwidth (medthick) Eê ASÊ) 
lpattern(dash) 
|| connect extent year, lwidth(medthick) 
msymbol (0) 
lcolor(navy) mcolor (navy) 
|| scatter gomext2 year if year == 2012, 
msymbol (S) 
mcolor (maroon) 
|| if year>1978, xlabel(1980(5)2030, grid) 
yline(0, lcolor(black)) 
yline(1, lcolor(gs11) lwidth(thick)) 
xtitle("") legend(order(4 2 1) label(2 
"Gompertz curve") 
label(4 "NSIDC extent") label (1. 
"'zchar(177)' 2sd") 
position(7) ring(0) col(1)) 
text(4.5 2019 "2012 Gompertz" "prediction" 
"4.3 (3.4 '-char(150)'5.1)", color (maroon) ) 






2012 Gompertz 
5 prediction 
x 4.3 (3.4-5.1) 






——*— NSIDC extent 
= Gompertz curve 
t 2sd 







1980 1985 1990 1995 2000 2005 2010 2015 2020 2025 2030 


الشكل )11.8( 
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فترة الثقة التي تظهر باللون الرمادي الفاتح في الشكل )11.8( تم 
إنشاؤها أولاء وقام الأمر twoway rarea‏ (مدى الفترة) بالتمثيل البياني 
للسنوات ما قبل 2012» ثم بعد ذلك تم إنشاء منحنى متوسط ذي لون أحمر 
داكن (mspline)‏ يمثل القيم المتوقعة لجومبرتز للفترة ما قبل 2012 وتم 
وضع هذا المنحنى فوق فترة الثقة الرمادية. بعد ذلك تم وضع قيم المتغير 
extent‏ في الشكل» وتم تمثيلها بخط متصل (connect)‏ الخطوة الخامسة 
والأخيرة تضمنت وضع ثوابت شكل الانتشارء وهي نقطة واحدة تمثل القيم 
المتوقعة لسنة 2012. Ul‏ النتصوص الموجودة في الرسم فهي تحدد القيمة 
الرقمية وحدود فترة الثقة لهذا التوقع» وكان لون الخط الخاص بالنصوص في 
الرسم البياني أحمر داكنا وهو نفس اللون لمنحنى القيم المتوقعة» هناك Lad‏ 
خط أفقي رمادي عند Alii‏ 1 مليون كم” (yline(1))‏ تمثل المستوى المنخفض 
للجليد خلال شهر سبتمبرء والذي يُعتبر فترة خالية من الجليد. 

يجب التأكيد على أن منحنيات التنبؤ بهذا النمط لاتمثل طريقة موثوقة 
لتوقع المستقبل. وهذا النموذج بالذات لا يعطي فهماً مادياً لما سوف يحدث 
Std‏ لا يعطي ماهو سبب انخفاض الجليدء فهذا يعتمد بالكامل على اختياراتنا 
الأولية للمتغيرات في النموذج الإحصائي» وكيف تتناسب هذه المتغيرات مع 
البيانات التاريخية؛ وكتطبيق إحصائي يمكننا تطوير هذه التوقعات البسيطة 
خطوة os pal‏ المنحنى في الشكل )11.8( ينخفض إلى أقل من 1 مليون كم* 
في سنة 5 معطياً نقطة توقع عملية للمناطق الخالية من الجليد في 
المنطقة القطبية الشمالية» ولكن حتى ولو ظهر أن نموذج جومبرتز إلى حد 
ما صحيح» فإننا يجب أن نتوقع بأن السلوك الواقعي لهذا المنحنى يتغير كما 
حصل في الماضي. 

بافتراض أن التباين حول المنحنى للسنوات القادمة يتبع التوزيع الطبيعي 
مع بعض الانحراف المعياري الذي يظهر في المنحنى في الفترات الماضية 
فإنه يمكننا محاكاة مثل هذا السلوك بإضافة تذبذب إلى منحنى التجانس 
واستخراج قيم عشوائية من توزيع طبيعي له انحراف معياري يساوي بواقي 
الفترات الماضية. فمثلاً الأوامر أدناه تقوم بإنشاء مجموعة جديدة من القيم 
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المتوقعة (gomext3)‏ زائدا تذبذبات طبيعية عشوائية مع الانحراف المعياري 

للبواقي (r(sd)‏ بعد الأمر summarize res‏ وإذا كان التنبؤ الجديد يُشير إلى 
أقل من ذلك. 

.quietly summ res 

gen gomext3 = gomext2 + r(sd)*rnormal() 


.replace gomext3 = 0 if gomext3« 0 
.replace gomext3 = extent if year == 2011 


الأوامر أدناه سوف تقوم بإنشاء رسم بياني للنتائج بطريقة مشابهة للشكل 
(10.8). 
.graph twoway rarea gomlo gomhi year if year«‏ 
color(gs13)‏ ,2012 
mspline gomext2 year if year« 2012,‏ || 
ands(60)‏ 


lwidth(thick) lcolor (maroon) 
|| mspline gomext2 year if year>= 2012, 


bands(60) 5 
lwidth(medthick) 1color (maroon) 
lpattern(dash) 

|| connect extent year, lwidth(medthick) 
msymbol1 (O) 


lcolor(navy) mcolor (navy) 

|| line gomext3 year if year»- 2011, 
lwidth (medthick) 

lcolor(midblue) 

|| , x1abe1(1980(10)2030, grid) 
yline(0, lcolor(black)) yline(1, 
lcolor(gs11) lwidth(thick)) 
ylabel(0(1)8) ytitle("") xtitle("") 
legend(order(4 2 1 5) label(2 "Gompertz 
curve") 5 

label(4 "NSIDC extent") label(1 
"'schar(177)' 2sd") 

label(5 "simulated") position(7) ring(0) 
col(1) rowgap(*.3)) 
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Gompertz extent simulation: some possible future paths 
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graph: L Hamilton 6/21/2012 
data through 2011: NSIDC 


الشكل )12.8( 


في كل مرة نقوم بها بإدخال الأوامر أعلاه» سوف نحصل على قيم 
متذبذبة عشوائية مختلفة» وبالتالي رسم بياني مختلف. الشكل (12.8) يجمع 
أربعة أشكال بيانية في شكل واحد يساعد في التأكيد على الانحراف غير 
المتوقع من سنة لأخرى. امتداد الجليد في أي سنة قد يرتفع أو ينخفض› 
وحيث إن المنحنى يعرض متوسط التغيرات» فمن غير المتوقع أن تتطابق 
هذه الأشكال. 

ual‏ الرسومات البيانية المنشورة تبقى لفترة طويلة» ويتم تداولها 
لأهداف لم ينو الكاتب القيام بهاء واستخدامها بدون علم الكاتب نفسه. لذلك 
فإنه من الأفضل أن تقوم بوضع اسمك» ومصدر البيانات» وأي معلومات 
إيضاحية أخرى GE‏ الرسم البياني نفسه» كما هو واضح في الشكل )12.8( 
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باستخدام الخيارات ccaption y note‏ الأمر أدناه يقوم بدمج أربعة أشكال في 
صورة واحدة ثم سميتها Gompertz extent‏ و Gompertz extent2‏ و هكذا. 


-graph combine Gompertz extenti.gph 

Gompertz extent2.gph 
Gompertz extent3.gph Gompertz extent4.gph, 
title("Gompertz extent simulation: some 
possible future 
paths", size(medlarge)) 
caption("data through 2011: NSIDC") 
note("graph: L Hamilton 6/21/2012") 
imargin(small) col(2) 
lititle("September sea ice extent, million 
km* =char (178) '") 


Box-Cox Regression : ux$o$ 7 أحدار بوكس‎ 


نترك بيانات المناطق الباردة خلفناء ونبدأ بالعمل على بيانات التنمية 
البشرية للأمم المتحدة في بقية هذا الفصل. هذه البيانات مؤجودة بالملف 
العلاقات غير الخطية بين المتغيرات واضحة في أشكال 
الانتشار لهذه البيانات»ء وهذه الأشكال مشل الشكل (4.7)ء اللوغاريتمات 
Goby‏ التحويل الأخرى من el‏ توكي للقوى Tukey's ladder‏ (تم الإشارة 
aul‏ في الفصل 5) تعتبر أدوات بسيطة تجعل العلاقات غير الخطية أكشر 
خطية» مما يُمكننا من تطبيق OLS‏ والانحدار الموشوق والنماذج الخطية 
الأخرى. 

اختيار استخدام أي طريقة تحويل قد يتضمن محاولة عدة خيارات 
واختبار كيف. إن كل خيار يؤثر في التوزيعات وأشكال الانتشار والبواقي. 
هناك مدخل منهجي يُسمى انحدار بوكس - كوكس بدلا من استخدام تقدير 
الأرجحية العظمى لاختيار معلمات تحويل بوكس - كوكس التي تعتبر أفضل 





Sc 384‏ مع gan‏ ممق 





ia استخدضا يت‎ JS! معين- تحويل بوكر - كوكر‎ jon nig 
D» gta) أو أي مجموعة فرعية من‎ cig عنى كل المتغيرات في‎ 

X تحدر متونط العمر لمتوقه عنى‎ Jb le على‎ IL, 
ومتغير وهمي يتم إتشؤه عن صرق الأمر‎ E 
AEA C. والذي يشير إلى‎ tabame 


-RSE C:\data\iistions3.dta, clear 
-describe life adfert urben gdp chldmort school 


regi 
ro ung EO 2E — crc ze Waa me 
حت‎ Zar ¥ «c BS sug mur ic n 215 KI 
a= ت‎ & ow fee L2— - os TID 2 St 21 
cz Sour Ekg Xer ee ae ZI 2-1 
*» umm E E TE Goer? oer pr rR 21152 MK E 
ن‎ Tuc Ek BE DeImc ire age i ow nos 
ZEE m 
EEG. Zar "5 fem ves ag ams ME 2-1 
2 we "à =g سر ووس وعد‎ 


يعست هنګ ققد قي تحويل متعر قي oe)‏ مت A Ss veg)‏ 
الانتشار اقمتغيرات الأخرى يعرض مط غير خطية تجعنها مرش حة 
قتحويل. في هذا فمتلء تقوم Be pid ja Se‏ على Spd‏ 
قطرف الأيمر هو عة والتي يكون قي العدة قي شكل صق >a Es‏ 
مطلوب لكل المتغيرات قي الطرف eL. AP‏ الستعير :عم هده 
الاح ارات y Sas‏ شيم يه بس تحار 523 — mdeiirhennis)‏ 
ARS 7j AX ->s mermere)‏ لمتعيرف ig!‏ لا Sas‏ 
-bomcom life adfert urban gdp chldmort school,‏ 

model(rhsonly) zotrans(reg1) dd 
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Fitting full model 


Iteration 0: log likelihood = -455.39883 (not concave) 
Iteration 1: log likelihood = -430.26519 
Iteration 2: log likelihood = -429.92904 
Iteration 3: log likelihood = -429.92798 


Iteration 4: log likelihood = -429.92798 
(15 missing values generated) 

(1 missing value generated) 

(6 missing values generated) 

(15 missing values generated) 

(1 missing value generated) 

(6 missing values generated) 

(15 missing values generated) 

(1 missing value generated) 

(6 missing values generated) 


Number of obs = 178 
LR chi2(7) = 463.38 
Log likelihood = -429.92798 Prob > chi2 = 0.000 







life Coef. Std. Err. z P»|z| (95% Conf. Interval] 














/ lambda .4867359 .0513717 .3860492 .5874226 


Estimates of scale-variant parameters 














Notrans 





-2.863907 
86.17721 


regl 
_cons 





Trans 


adfert -.0383667 
urban .2065436 
gdp . 000283 
chldmort -1.42784 


school -1.601755 


2.708479 











Test Restricted LR statistic P-value 

H0: log likelihood chi2 Prob » chi2 
lambda = -1 -524.20312 188.55 0.000 
lambda = 0 -476.81642 93.78 0.000 
lambda - 1 -455.39883 50.94 0.000 





وروي mme‏ من الل | 
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Re. REED‏ د nsa cad cab‏ 


قيمة (لمدا) المعطاة في جدول المخرجات أعلاه )04867359 = (i‏ هي 
المعلمة المختارة للشكل العام لتحويلات بوكس - كوكس 
XY = ^-1‏ 
مُعاملات الانحدار المعروضة في جدول مخرجات بوكس - كوكس 
أعلاه تتعلق بانحدار gale‏ لمتغيرات تم تحويلها في هذا النمط بالإمكان 
تكرار نتائج انحدار بوكس - كوكس بواسطة إنشاء نسخة محولة من كل 
متغير ثم استخدام الأمر -regress‏ 


.gen bc2adf (adfert^.4867359-1)/.4867359 
.gen bc2urb = (urban^.4867359-1)/.4867359 
.gen bc2school = (school^.4867359-1)/4867359 
.gen bc2gdp = (gdp^.4867359-1)/.4867359 

.gen bc2chld - (chldmort^.4867359-1)/.4867359 
.regress life bc2* reg1 






















Source Number of obs - 178 
F( 6, 171) = 356.47 

Model 16332.407 6 2722.06783 Prob > F = 0.0000 
Residual 1305. 78282 171 7.63615683 R-squared = 0.9260 
Adj R-squared = 0.9234 

Total 17638.1898 177 98 Root MSE = 2.7634 

















Coef. Std. Err. [95$ Conf. Interval) 











bc2adf -.0383667 .0598489 0. -.1565045 .0797711 
bc2urb .2065436 .0955322 2.16 0.032 .0179693 .395118 
be2school -1.60e+07 3209717 -4.99 0.000 -2.24e+07 -9681777 
bc2gdp .000283 .0035913 0.08 0.937 -.006806 .0073721 
bc2chld -1.42784 .0792446 -18.02 0.000 -1.584263 -1.271416 
regl -2.863907 .674814 -4.24 0.000 -4.195945 -1.531869 
_cons 86.17721 1.909628 45.13 0.000 82.40773 89.94669 








انحدار بوكس - كوكس وجد أن معلمة التحويل < هي الأمثل في سياق 
معيار الأرجحية العظمى. مقابلة متطلبات هذا المعيار لا تعني بالضرورة أن 
العلاقات أصبحت خطية. الهدف الأخير - وهو جعل العلاقات خطية - ربما 
oio tidy‏ ار dd ace‏ الفا سن خلال ig 9 ge a dias:‏ 
والحكم الشخصي مع احتمالية استخدام تحويلات مختلفة للمتغيرات. 
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الاسناد اطتعدد ail)‏ اطفعوده : 


Multiple Imputation of Missing Values 


ملف البيانات Nations3.dta‏ يحتوي على معلومات عن 194 41,3« ولكن 
القيم المفقودة تقيّد التحليل الذي قمنا به في الجزء السابق ليكون التحليل 
لمجموعة فرعية Ai Se‏ من 178 دولة لها معلومات متكاملة لكل المتغيرات. 
مدخل قائمة الحذف الذكية لاستبعاد القيم المفقودة وهي ممارسة إحصائية 
شائعة بدافع الضرورة ومن عيوبها المعروفة خسارة بعحض المشاهدات» 
ونقص القوة الإحصائية» وإذا كانت المشاهدات ذات القيم المفقودة تختلف 
بار كبيرة عن باقي المشاهداتء؛ فإن قائمة الحذف الذكية قد تؤدي إلى 
تحيّز المُعاملات المقدرة. 
قد تكون هناك متغيرات أخرى في البيانات التي ترتبط إحصائياً بالقيم 
المفقودة. في مثل هذه الحالات» فإن الانحدار يمكن أن يُستخدم لتوقع TY‏ 
القيم المفقودة وهذه التوقعات تستخدم كبديل للقيم المفقودة في خطوات 
تالية. إسناد الانحدار للقيم GE PELEN E E EE 4 1S4 $3 gii‏ $ 
الإحصائية الظاهريةء وتقليل احتمالية الحصول على DLL ale‏ متحيّزة. 
وعموما ex! ols‏ المُسندة سوف يكون لها تباين منخفض عن تلك القيم 
الموجودة لأي متغير» مما يؤدي إلى تقديرات خطأ معياري متحيزة تقتترب 
من الصفر. بعبارة أخرى إسناد الانحدار قد يتسبب في الحصول على 
تقديرات مبالغ فيها في الدقة أو المعنوية الإحصائية للنتائج المحسوبة. 
الإسناد المتعدد للقيم المفقودة يبدأ من الفكرة الأساسية لإسناد الانحدار ثم 
تتم إضافة خطوات أخرى للحصول على تقد تقديرات واقعية للاخطاء المعيارية 
أو عدم التأكد. هذه الخطوات تتضمن إنشاء مجموعات متعددة من المشاهدات 
الوهمية تستخد م كبديل للقيم المفقودة» وذلك عن طريق توقعات الانحدار زائدا 
تذبذبات عشوائية. ثم الخطوة الأخيرة. هي جمع معلومات الإسناد المتعدد 
لتقدير نموذج الانحدار مع أخطائه المعيارية واختباراته. 
مجموعة أوامر ستاتا mi‏ لإجراءات الإسناد المتعدد تدعم عددًا من طرق 
تنظيم البيانات» وطرق التقديرء وتقنيات إنشاء النماذج بما فيها النماذج 
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اللوغاريتمية للمتغيرات النو عي« دليل المستخدم Stata Multiple-Imputation‏ 
Reference Manual‏ يغطي هذا الخيارات» بالإضافة إلى عدد آخر إضافي 
يحتوي على أمثلة أكثر تعقيدا. 


وكمثال بسيطء يمكننا العودة إلى تحليل انحدار متوسط العمر المتوقع. 


„use C:\data\Nations3.dta, clear 
.regress life adfert. urban loggdp  chldmort 
school regi 




























Source Number of obs - 178 
F( 6, 171) = 246.57 

Model 15810.6966 . 6 2635.1161 Prob > F = 0.0000 
Residual 1827.49317 171 10.6870946 R-squared = 0.8964 
Adj R-squared = 0.8928 

17638.1898 177 99.6507898 Root MSE = 3.2691 





















Coef. Scd. Err. [95$ Conf. Interval] 












adfert .0039441 .0091498 -0.43 0.667 -.0220053 .014117 
urban .0397506 .016287 2.44 0.016 . -0076012 .0718999 
loggdp 2.90728 .9196223 3.16 0.002 1.092007 4.722554 
chldmort -.1314439 .0102063 -12.88 0.000 -.1515905 -.1112972 
school -.3322321 .1480558 -2.24 0.026 -.6244844 -.0399798 
regl -3.56938 . 7845902 -4.55 0.000 -5.118109 -2.02065 
-cons 65.3779 3.124978 , 0. 59.2094 71.5464 








هناك ثلاثة متغير ات في هذا التحليل — loggdp, chldmort, school‏ ¬ بها 
قيم مفقودة» وهذه المتغيرات مجتمعة تؤدي إلى انخفاض مشاهدات العينة من 
4 إلى 178 مشاهدة. 


-Summarize life adfert urban loggdp chldmort 
school regi 


Variable 







Obs Mean Std. Dev. Min Max 









68.7293 10.0554 45.85 82.76666 


adfert 194 51.81443 44.06612 1 207.1 
urban 194 55.43488 23.4391 10.25 100 
loggdp 179 3.775729 .5632902 2.446848 4.874516 
chldmort 193 47.65026 52.8094. 2.25 209 


school 


188 7.45922 2.959589 1.15 12.7 
regl o 


194 .2680412 -4440852 ^70 1 
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الأمر misstable summarize‏ يحسب ثلاثة أنواع من المشاهدات بناء 
على حالة القيم المفقودة لتلك المشاهدات: 
obs=.‏ القيمة المفقودة الافتراضية لبرنامج ستاتاء ويُشار إليها 
ب "المفقود الناعم". 
obs».‏ رموز القيم المفقودة تعرضص كحروف مع نقاط «al .c, .b, .a Sie‏ 
ويمكن إضافة توصيف لهاء ويشار إليها ب "المفقود الخشن". 
obs<.‏ قيم موجودة. 
يمكن لبرنامج ستاتا إدخال قيم مفقودة ناعمة chii‏ ولا يمكنه إإخال 
القيم الخشنة. وتجب الإشارة إلى أن جميع القيم المفقودة في ملف البيانات 
Nations3.dta‏ هي من النوع الناعم» ولذلك فإن الوضع أسهل. وهناك مثال 
لدراسة استقصائية تحتوي على قيم خشنة سوف يتم تناوله في الفصل (9). 


.misstable summarize life adfert urban loggdp 
chldmort school regi 


(UN Human Development Indicators) 


.. misstable summarize life adfert urban loggdp chldmort school regl 
Obs«. 










Unique 






Variable values 









179 2.446848 4.874516 
144 2.25 209 
1.15 12.7 


loggdp 
chldmort 
school 












الخطوة الأولى في الإسناد المتعدد هي تحديد البيانات باستخدام الأمر. 
«mi set‏ والذي يحدد كيف يتم تنظيم القيم المدخلة. هناك أربع طرق محتملة 
- تم شرحها في دليل المستخدم —Reference Manual‏ ففي مثالنا الحالي سوف 
تختار طريقة الذاكر ة الفعالة anlong‏ حيث إن المشاهدات الجديدة أو 
الصفوف سوف تضاف للبيانات. 


-mi set mlong 
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عند تسجيل الإسناد المتعددء فإن القيم المفقودة في البيانات الأصلية غير 
المُسندة سوف تسجل على أنها un-0‏ عمليات الإسناد مع مجموعات من القيم 
التي تم إدخالها كقيم مفقودة تسجل على أنها 1= ”,2= ”,3= ” 9 dia‏ حرف 
M‏ بشن إلى عدد عمليات:الإستاد التى ثم pii‏ نها. وقبل التقدم .2-3 تحن 
نحتاج إلى تسجيل المتغيرات التي نريد إسنادها في واحد من الأنواع الثلاثة 
التالية: 

imputed‏ المتغير له قيم مفقودة تحتاج إلى إسناد. 


passive‏ متغير وهو عبارة عن دالة للمتغيرات. المُسندة أو دالة لمتغيرات 
سلبية» وهذا المتغير سوف تكون له قيم مفقودة في البيانات 
الأصلية (m-0)‏ وقيم متفاوتة لكل إسناد )1 — m 72 «m‏ وهكذا). 
٣ع‏ لا المتغيرات المسندة ولا السلبية تكون لها نفس القيم» (المفقودة 
أو الموجودة) لكل . 
مثالنا الحالي له قيم مفقودة بالمتغيرات doggdp, chldmort, school‏ لذلك 
تم تسجيل هذه المتغيرات كمتغيرات مسندة imputed‏ 
mi register imputed loggdp chldmort school‏ 
المتغير ات الأخرى life, adfert, urban, reg]‏ لا تحتوي على قيم مفقودة» 
ويجب أن تسجّل كمتغيرات منتظمة regular‏ 
-mi register regular life adfert urban reg1‏ 
الخطوة التالية تقوم بالإسناد الفعلي» والقيم المفقودة للمتغير ات loggdp,‏ 
chldmort, school‏ (متغير (mi register imputedci‏ يتم إسنادها عن طريق 
انحدار متغيرأت mi register regular‏ وهي «regl, adfert, urban‏ سوف 
نستخدم طريقة الانحدار الطبيعي متعدد المتغيرات (mvn)‏ وسوف يكون هناك 
0 إسنادا مستقلاً يُشار إليها ك m-0‏ (وهي البيانات الأصلية التي تحتوي 
على قيم مفقودة) أو m=‏ وحتى m-50‏ وكل منها تحتوي على إسنادات ل 
6 مشاهدة كانت أصلا قيما مفقودة في البيانات الأصلية. لذا فإن 
0 -800 مشاهدة سوف تضاف إلى البيانات» مما يجعل مجموع 
المشاهدات 964-800+194 مشاهدة. 
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-mi impute mvn loggdp chldmort school = adfert 
urban regi, add(50) rseed(12345) 


Performing EM optimization: 
observed log likelihood - -780.80745 at iteration 6 


Performing MCMC data augmentation ... 


Multivariate imputation * Imputations = 50 
Multivariate normal regression added = 50 
Imputed: 721 through 7750 updated - 0 
Prior: uniform Iterations - 5000 
burn-in - 100 
between = 100 






Observations per 7 








Variable Complete Incomplete Imputed 







loggdp 
chldmort - 
school 






(complete + incomplete - total; imputed is the minimum across 7 
of the number of filled-in observations.) 


الحصول على 50 قيمة مُسندة مستقلة كل منها تحتوي على قيم مفقودة 
تم استبدالهاء هذا يوفر قاعدة للتقديرات التي سوف تقوم بها lis‏ للاختلافات 
من عينة لأخرى عند قيامنا بجمع هذه القيم للانحدار. الخيار rseed(12345)‏ 
في الأمر mi impute‏ يقوم بتحديد نظام اختياري ليوك الأرقام العشوائية 
ببرنامج ستاتا. يمكننا إنشاء مثال قابل للتكرار عن طريق استخدام الخيار 
56600 » وهذا المثال قد يكون مقبولا لأهداف تعليمية. غير ذلك»ء فإن ستاتا 
سوق يخكار lul‏ الخاضن به GWG! Line‏ يسيطة فى ie pila)‏ 
استخدام الأمر في المرة التالية. 
. الخطوة الأخيرة تستخدم هذه الإسنادات لتحليل انحدار متغير متوسط 
العمر المتوقع على 6 متغيرات تنبؤية. مبدئياً فإن عملية الإسناد تؤدي إلى 
تقديرات أكثر كفاءة (أخطاء معيارية منخفضة) وتقلل من التحيّز عند تحليل 
الانحدار الذي استبعد كل المشاهدات التي تحتوي على قيم مفقودة. 
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HEAD GS ا‎ ———P—— Lo 


.mi estimate, dots: regress life adfert urban 
loggdp chldmort school regi 


Imputations (50): 


A000... 50 done‏ كا عه 0 موه ينا فوج وب ee LO.‏ لمم 

Multiple-imputation estimates: Imputations z 50 
Linear regression Number of obs - 194 
Average RVI z 0.0365 

Largest FMI z 0.1167 

Complete DF z 187 

DF adjustment: Small sample DF: min = 156.85 
avg = 172.10 

max = 184.02 

Model F test: Equal FMI F( 6, 184.7) - 240.19 
Within VCE type: . OLS Prob » F = 0.0000 

















Coef. Std. Err. {95% Conf. Interval] 















adfert -.0044855 .0091363 0. -.0225124 .0135414 
urban .047157 .0163199 2.89 0.004 .014945 .079369 
loggdp 2.704804 9755022 2.77 0.006 -7779876 4.63162 
chldmort -.1305611 .0102536 -12.73 0.000 -.1507939 -.1103283 
school -.3317234 1527427 -2.17 0.031 -.6332567 -.0301902 
regl -3.814368 .8011135 -4.76 0.000 -5.394917 -2.23382 
-cons 65.78153 3.297027 0. 59.27041 72.29265 





نتائج الأمر mi estimate‏ تشبه بدرجة كبيرة تلك التي حصلنا عليها من 
تحليل الانحدار العاديء هذا يمثل أفضل سيناريو تتشابه فيه الطرق المعقدة 
والبسيطة» حيث إن النتائج تظهر مستقرة بشكل معقول. وفي أي تقرير بحثي 
يمكننا عرض التحليل مع الملاحظات التوضيحية لتوضيح أننا اس تخدمنا 
مدخلا آخر للاختبار» وحصلنا على نفس النتيجة. 

الفصل )9( يوضح مثالاً ثانياً للإسناد المتعدد باستخدام بيانات دراسة 
استقصائية Ya‏ من نماذج الانحدار الخطية. وللحصول على مزيد من 
التفاصيل عن هذا الموضوع قم بطباعة الأمر help mi‏ أو الاطلاع على Jala‏ 
المستخدم -Stata Multiple-Imputation Reference Manual‏ 


Structural Equation Modeling : اطعادلة الهيكلية‎ tals 


نماذج الانككار السابقة تعاملت مع خصوبة المراهقين» والنسبة المئوية 
للمناطق الحضرية» والخصائص المحلية الأخرى كمتغيرات تنبؤية محتملة 
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لمتغير متوسط العمر المتوقع بدون ضرورة التأكيد على أن هذه المتغيرات 
هي مسببات لمتوسط العمر المتوقع. أحد هذه المتغيرات التنبؤية هو متغير 
معدل وفيات الأطفال والذي كانت له علاقة سببية بمتوسط العمر المتوقعء 
ولكن معدلات وفيات JULY!‏ بدورها خاضعة للتأثر بالخصائص المحلية 
الأخرى مثل ماهو العمر المتوقع مما يجعل العلاقة السببية أكثر تعقيد B asi’‏ 
سبيل المثال» I3‏ كانت معدلات الخصوبة لدى المراهقين A‏ على وفيات 
الأطفال ووفيات الأطفال تؤثر على متوسط العمر المتوقع؛ إذن فإن خصوبة 
المراهقين لها تأثير غير مباشر على متوسط العمر المتوقع وما إذا كان 
متوسط المتوقع له تأثير مباشر واضح. وفي سياق العلاقة السببية» فإن معدل 
وفيات JULY!‏ يعمل كمتغير وسيط أو دخيل. ٠‏ 

نماذج المعادلة الهيكلية تعتبر طريقة منتظمة لتحليل مثل هذه التأثيرات 
غير المباشرة مع الأنواع الأخرى للعلاقات السببيةء وتوضيح هذه النماذج 
يظهر في الرسم البياني للمسار الذي يعرض بعض الأفكار حول الترتيب 
ARMAS‏ السببية. SE‏ السببي Si‏ أمر d das E‏ المعادلة 
التقنيات الإحصائية PET po‏ وتطوير B‏ بطريقة ub‏ يجب 
علينا الاعتماد على المعرفة الخارجية أو النظرية لتحديد الترتيب السببي 
البسيط. وإذا كانت المعرفة ضعيفة» فإن التحليل الذي يتبعه سوف يكون 
ضعيفا أيضاء ولكن إنشاء رسم بياني للمسار يعتبر خطوة مفيدة حتى ولو 
كان الترتيب غير مؤكد. وفي العادة فإن الرسم البياني يساعد في توضيح 
الأفكار الغامضة أو شرح أفكارنا. 

المداخل التي تعتمد على نماذج المعادلة الهيكلية أصبحت تهيمن على ٠‏ 
العديد من مجالات مختلفة في البحوث العلمية» نماذج المعادلة الهيكلية تتعلق 
بشكل خاص بالعلوم الاجتماعية لأنها تريد سد الفراغ الموجود بين المجالات 
النظرية والبيانات. النماذج أصبحت العنوان الرئيس للكثير من الكتب التي 
تناولت قضايا مثل التقديرء ونماذج القياس» وهياكل الخطأ والأسباب المتبادلة 
(انظر Skrondal and Rabe-Hesketh «2010 Kline‏ 2004(« مع الإصدار 12 
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pond S SS 
لبرنامج ستاتا قام البرنامج بإضافة أوامر نماذج المعادلة الهيكلية الخاص به.‎ 
Structural Equation حيث ورد في دليل المستخدم نماذج المعادلة الهيكلية‎ 

: Modeling Reference Manual 


نماذج المعادلة الهيكلية ليست فقط طرق تقدير لنموذج معين بنفس 
طريقة الأمر regress‏ والأمر probit‏ أو حتى بنفس طريقة الأمر stcox‏ والأمر 
xtmixed‏ ولكن نماذج المعادلة الهيكلية هي طريقة تفكير وكتابة وتقدير . 
هذا الجزء من الكتاب يشرح أمر نماذج المعادلة الهيكلية لبرنامج ستاتا 
sem‏ من خلال توسيع مبسط لانحدار متوسط العمر المتوقع. كنا قد رأينا 
سابقا أن متوسط العمر المتوقع تم تقديره بواسطة الخصائص المحلية 
الأخرى؛ في جدول الانحدار أدناه إحصائيات ؛ وأوزان Lan‏ أو مُعَاملات 
الانحدار المعيارية (العمود الموجود في الجانب الأيمن) توضح أن معدل 
وفيات الأطفال له أكبر تأثير. 
.use C:\data\Nations3.dta, clear‏ 


.regress life adfert urban loggdp  chldmort 
school regi, beta 

















Source 





Number of obs = 978 

Fi 6, 971) = 868.88 

Mudel 88961.6088 6 14826.9681 Prob > F = 0.0000 
Residual 16569.5108 971 17.0643778 R-squared = 0.8430 
— Adj R-squared = 0.8420 

Total 105531.32 977 108.01568 Root MSE = 4.1309 





Coef. Std. Err. 


adfert -.0186354 .0061076 -3.05 0.002 -.0542246 
urban .0926001 .0077519 11.95 0.000 .2355879 
loggdp .B178748 .4963185 1.65 0.100 .0425882 
chldmort -.1065984 .0063543 -16.78 0.000 -.4893582 
school -.1540576 .0804122 -1.92 0.056 -.0408058 
regl -7.910748 .6323653 -12.51 0.000 -.2744216 
-cons 68.87724 1.743847 0. 






عند كتابة الأمر sem‏ يمكننا إدخال نفس النموذج وذلك كما يلي: 


.Sem  (life«- adfert urban loggdp  chldmort 
school regl1), standard 
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(16 observations with missing values excluded; 
specify option 'method(mlmv)' to use all observations) 


Endogenous variables 

Observed: life 

Exogenous variables 

Observed: adfert urban loggdp chldmort school regl 
Fitting target model: 


Iteration 0: log likelihood = -18660.532 


Iteration 1: log likelihood = -18660.532 

Structural equation model Number of obs = 978 
Estimation method = ml B 

Log likelihood = -18660.532 









OIM 
Coef. Std. Err. z P» |z| [95$ Conf. Interval] 





Standardized 













Structural 


life «- 

adfert -.0542246 .0176934 -3.06 0.002 -.088903 -.0195462 
urban .2355879 .0194051 12.14 0.000 .. .1975547 .2736211 
loggdp .0425882 .0257454 1.65 0.098 -.0078719 .0930483 
chldmort -.4893582 .0283438 -17.27 0.000 -.5449109 -.4338055 
school -.0408058 .0212159 -1.92 0.054 -.0823882 .0007767 
regl -.2744216 .0215576 -12.73 0.000 -.3166737 -.2321695 

cons 6.630625 .1869022 0. 6.264304 6.996947 











Variance 
e.life 









.1570104 






.0070122 





.1438511 .1713735 


LR test of model vs. saturated: chi2(0) = 0.00, Prob > chi2 = 


cl (Ga) Had نادي‎ sem انر‎ Che gis ف‎ ENERO ERA 

TENE e‏ عليها باستخدام الأمر cregress‏ وبخلاف الأمر cregress‏ فإن 
الأمر sem‏ يعرض الأخطاء المعيارية للمُعاملات المعيارية» وهذا يؤدي إلى 
الحصول على إحصائيات 2 تشبه إخصائيات ء التي أظهرها الأمر regress‏ 
ولكن مع احتمالات مختلفة اختلافاً بسيطأً بسبب مقارنتها مع التوزيعات 
الطبيعية المعتدلة Ya‏ من توزيعات uc‏ أن كتابة الأمر sem‏ بين الأقواس 
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(life<- adfert urban loggdp chldmort school reg!)‏ يحدد المسارات السببية 
للمتغير life‏ مع المتغيرات adfert, urban‏ ... الخ. 

معدل وفيات الأطفال هو أقوى متغير تنبؤي لمتغيز متوسط العمر 
المتوقع ويمكن تقديره - متوسط العمر المتوقع - من العديد من الخصائص 
المحليةء UÍ‏ خصوبة المراهقين والتي أظهرت نتائج لم تكن ذات معنوية 
إحصائية مع متوسط العمر المتوقع في نتائج الأمر regress‏ أو نتائج الأمر 
sem‏ في الجدول أعلاه هي أقوى متغير تنبؤي لمعدل وفيات SUEY!‏ 


.regress chldmort adfert urban loggdp school 
regi, beta 

























Number of obs - 978 

Ft. 3 972) = 060 

Model 1801371.17 5 366274.235 Prob > F = 0.0000 
Residual 422622 .667 972 434.796983 R-squared = 0.8100 
Adj R-squared = 0.8090 

2223993.84 977 2276.34989 Root MSE = 20.852 





chldmort 





Coef. 









Std. Err. 


adfert .2318316 .0299192 7.75 0.000 .1469444 
urban .0245631 .0391215 0.63 0.530 .0136128 
loggdp -15.56996 2.455012 -6.34 0.000 -.1766092 
school -5.479663 -3658743 -14.98 0.000 -.316167 

regl 57.32674 2.609213 21.97 0.000 . 4331934 
—cons 128.5363 7.777316 0. 









الشكل )13.8( يعرض Lay‏ بيانياً للمسار الذي يظهر به متغير معدل 
وفيات الأطفال كمتغير دخيل تأثر بمتغير خصوبة المراهقين والخصائص 
الأخرى» وهو أيضاً متغير تنبؤي لمتوسط العمر المتوقع. ومن الناحية 
النظريةء فإن السبب يتجه من اليسار إلى اليمين في الشكل ou‏ والتأثيرات 
غير المباشرة يمكن أن تتبع أي مسارات تتراوح من المتغيرات التي تمثل 
الخصائص المحلية للمجتمع إلى متغير معدل الوفيات chidmort‏ ومن متغير 
chldmort‏ إلى متغير Giles yall ife‏ الظاهرة في الرسم أدناه تمثل متغيرات 
منظورة في النموةج» سوف يتم التطرق إلى موضوع المتغيرات غير 
المنظورة أو المخفية في الفصل (12). 
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الشكل (13.8) 


الشكل )13.8( أعلاه تم إنشاؤه باستخدام واجهة المستخدم البيانية 
(GUDgraphical user interface‏ و التي تسمى «SEM Builder‏ ويمكن الحصول 
على مربع حوار واجهة المستخدم البيانية من خلال طباعة الأمر: 
.Sembuilder‏ 
أو بواسطة استخدام قائمة ستاتا: 
Statistics » SEM (structural equation modeling)‏ 
Model building and estimation‏ » 
للحصول على معلومات عن كيفية call‏ في استخدام واجهة المستخدم 
البيانية قم بطباعة الأمر help sembuilder‏ العناصر الرئيسة في الشكل 
)13.8( هي المتغيرات المنظورة:؛ أول شيء لإنشاء الرسم البياني تتم 
بإضافة مربعات خالية باستخدام أداة إضافة متغير ملحوظ Add Observed‏ 
Variable‏ من القائمة الموجودة في يسار الشاشةء ثم بعد ذلك تتم إضافة 
أسماء المتغيرات عن طريق اختيار كل مربع باستخدام Select sl‏ وإضافة 
الأسماء من خلال القائمة المنسدلة sl «Variable‏ إضافة المسار Add Path‏ 
يمكنها ربط المتغيرات» وما عليك إلا النقر على المتغير الخارجي أو المسبب 
ثم سحبه إلى السهم ليربط المتغير الداخلي أو المتأثر. 
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من قائمة شريط الأدوات الموجودة في أعلى الإطار قم باختيار 
Estimation > Estimate‏ للحصول على المُعاملات والإحصائيات الأخرى 
للنموذج. الشكل )14.8( يعرض النتائج الافتراضية لتقدير الشكل )14.8(« 
وكل مسار متعلق مع مسار معياري أو معامل انحدار مثل معامل انحدار 
adfert‏ على chldmort‏ 0.23 (قارن مع جدول الانحدار أعلاه). 





الشكل (14.8) 


في كل مربع لكل متغير خارجي في الشكل (14.8) لدينا متوسط وتباين 
للمتغير. التحليل الموجود لدينا يحتوي على 178 دولة:؛ متوسط المتغير 
adfert‏ يساوي 32 clay sit‏ والتباين يساوي 02-0+ه9.1: مربعات المتغيرات 
الخارجية تحتوي على قيم تقاطعها مع المحور العمودي 1.3e+02=130 Sia y‏ 
للمتغير /-ه::4/:/». مرة أخرى قم بالمقارنة مع نتائج الانحدار السابقء وأخيرا 
الشكل (14.8) يعطي تباين البواقي المتعلقة بالخطأ العشوائي El(chldmori)‏ 
-E2(life) 4‏ 

وهناك إصدار أكثر بساطة للشكل أعلاه يحتوي على مُعاملات المسار 
المعياري» وتجاين البواقي المعيارية في الشكل )15.8(« هذا التبسيط يمكن 
القيام به عن طريق قائمة الاختيارات الموجودة في أعلى SEM Builder Ua)‏ 
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Settings > Variables > All .. > Results > 
Exogenous variables > None > OK 

Settings > Variables > All .. > Results > 
Endogenous variables > None > OK 

Settings > Variables > Error .. > Results > 
Error std. variance > OK 

Settings > Connections > Paths > Results > Std. 
parameter > OK 

Settings > Connections > All > Results > Result 
1 > Format 53.22 > OK > OK 

Settings > Connections > All > Results > Result 
2>None > OK 

Estimation > Estimate > OK 





الشكل )15.8( 





الشكل )15.8( يتعلق بالأمر sem‏ أدناهء والذي له مجموعة من الأسئلة 
المنفصلة للمتغير life‏ و المتغير chidmort‏ 
.sem  (life«- adfert urban loggdp  chldmort‏ 


school regi) 


(chldmort«- adfert urban loggdp school regi), 
standardized i 1 





الإحصاء مع برنامج ستاتا 


777ل سبي مب يي بيك لس 


(16 observations with missing values excluded; 


specify option 'method(mlmv) ' 


Endogenous variable 


Observed: life chl 


Exogenous variables 


dmort 


Observed: adfert urban loggdp school regl 


Fitting target mode 


l: 


Iteration 0: log likelihood = -18660.532 
Iteration 1: log likelihood = -18660.532 
Structural equation model 
Estimation method = ml 
Log likelihood = -18660.532 
OIM 
Standardized Coef. Std. Err. z 
Structural 
life <- 
chldmort -.4893582 .0285822 -17.12 
adfert -.0542246 .0176966 -3.06 
urban .2355879 .0194596 12.11 
loggdp .0425882 .0257468 1.65 
school -.0408058 .0212174 -1.92 
regl -.2744216 .0216242^ -12.69 
_cons 6.630625 .1913384 34.65 
chldmort «- 
ad*ert 1459444 . 0187839 7.82 
urban .0136128 .0216136 0.63 
loggdp -.1766092 .0276417 -6.39 
school -.316167  .0205339  -15.À0 
regl -4331934 .0186128 23.27 
cons 2.695432 - 1604064 16.80 
Variance 
e.life . 1570104 .0072756 
e.chldmort .1900287 .0084368 
LR test of model vs. saturated: chi2(0) = 


to use all observations} 


Number of obs 


P»|z| 


0.000 
0.002 
0.000 
0.098 
0.054 
0.000 
0.000 


0.000 
0.529 
0.000 
0.000 
0.000 
0.000 


0.00, 


400 


[95$ Conf. Interval] 


-.5453783 
-.0889092 

.1974478 
-.0078746 
-.0823912 
-.3168041 

6.255609 


.1101287 
-.028749 
-.2307861 
-.3564127 
.396713 
2.381041 


.1433788 
.1741919 


Prob » chi2 


- 1 
-.01954 
.2737279 
.0930509 
.0007796 
-.232039 
7.005642 


.1837623 
.0559746 
-.1224324 
-.2759212 
. 4696738 
3.009822 


1719379 
. 2073053 


التأثير غير المباشر والكلي يمكن حسابه بسهولة يدوياء فالتأثير غير 
المباشر يساوي المُعاملاتء المتحصل عليها مع أي سلسلة للمسارات Asie‏ 
ای dea gs‏ ميزنا sgl‏ التأثير الكلي يساوي مجموع كل التأثيرات المباشرة 
وغير المباشرة التي تربط متغيرين اثنين. عند قراءة المُعاملات المعيارية من 
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الشكل (15.8) فإنه يمكن القول بأن خصوبة المراهقين تؤثر على متوسط 
العمر المتوقعء وهذه التأثيرات كما يلي: 
مباشر 0.05- 
غير مباشر 0.07- = 0.15x(-0.49)‏ 
كلي 0.12-=0.05-0.07- 
أو بعبارة أخرى» هذا النموذج يتوقع أنه في OLS Alla‏ العوامل SAY!‏ 
فإن زيادة الانحراف المعياري لمتغير خصوبة المراهقين بمقدار نقطة واحدة 
وذلك من خلال التأثيرات المباشرة وغير المباشرة. التأثير المباشر لمتغير 
adfert‏ أقرب للصفرء ولكنه سببي مهم بسبب التأثير غير المباشر لمعدل 
وفيات الأطفال. 
وبحسابات مشابهة لما قمنا به من قبل» فإن تأثير موقع أفريقيا 
(المشاكل الموجودة في أفريقيا لم يتم قياسها بأي متغير في النموذج) له تأثير 
أكثر من ضعف تأثير المتغير treg]‏ 
مباشر 0.27- 
غير مباشر 0.21- = 0.43x(-0.49)‏ 
كلي 0.48-=0.27-0.21- 
سوف نعود مرة أخرى لنماذج المعادلة الهيكلية في سياق التحليل العاملي 
factor analysis‏ بالفصل (12). 





MP 


Ug) 
الانحدار اللوغاريتمي‎ 


Logistic Regression 








طرق الانحدار التي سبق تناولها في الفصلين )7 5 8( تتطلب - بشكل 
عام - متغيرات تابعة قابلة للقياس. ولكن برنامج ستاتا يوفر عددًا FS‏ من 
التقنيات لصياغة النماذج التصنيفيةء والترتيبية» والمتغيرات التابعة المقاربة. 
القائمة أدناه تعرض بعض الأفكار لعدة طرق متوافرة. وللحصول على 
تفاصيل حول أوامر معينة» قم بطباعة الأمر chelp command‏ وتعتبر دراسة 
Long and Freese‏ (2006) من أفضل المصادر التي تشرح الطرق الرئيسة 
لبرنامج ستاتا للمتغيرات التابعة المحدودةء كما يمكنك الاطلاع على دراسة 
Hosmer and Lemeshow‏ )2000(- | 





-(McFadden ماك فادن‎ jui) بديل محدد بلوغاريتم مشروط‎ asclogit 
بانحدار الاحتمال المتعدد.‎ aa» بديل‎ 
بديل محدد بانحدار الاحتمال متعدد الرتب.‎ asroprobit 
الاحتمال الثنائي.‎ jas3  biprobit 
الانحدار الثنائي (نماذج خطية عامة).‎ binreg 
التقدير اللوغاريتمي مع بيانات مجمّعة (مقفلة).‎ blogit 
(مقفلة).‎ is تقدير احتمالي مع بیانات‎ bprobit 
الانحدار اللوغاريتمي للتأثيرات الثابتة المشروطة.‎ 
تقدير لوغاريتمي- لوغاريتمي مكمل.‎ 8 
تعريف وتخديد واستبعاد القيود الخطية.‎ constraint 
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الانحدار اللوغاريتمي الدقيق. 

نماذج خطية .عامة aii‏ تتضمن ISLS‏ لإنشاء نموذج لوغاريتمي أو 
احتمالي أو روابط لوغاريتمية مكملة» مما يسمح لمتغير 
الاستجابة ليكون تنائيا أو نسبيا لبيانات مجمعة. 

الانحدار اللوغاريتمي لبيانات مجمعة. 

الانحدار الاحتمالي لبيانات مجمعة. 

التقدير الاحتمالي مع الاختيار. 

التقدير الاحتمالي لاختلاف التباين. 

انحدار الفترة» حيث إن بر نقطة بيانات أوبيانات الفترة أو 
بيانات تم فحصها مسبقا. 

الاحتمال مع متغيرات الانحدار الخارجية المستمرة. 

الانحدار اللوغاريتمي مع دسب الاحتمال. 

الانحدار اللوغاريتمي وهو مشابه logistic JU‏ ولكن يعطي 
مُعاملات بدلا من نسب احتمال. 

الانحدار اللوغاريتمي المتعدد للمتغيرات y‏ متعددة التدريج. 
تقدير لوغاريتمي متداخك. 

الانحدار اللوغاريتمي لمتغيرات بر الترتيبية. 

الانحدار الاحتمالي لمتغيرات ر الترتيبية. 

الانحدار الاحتمالي لمتغير y‏ الثنائية. 

النموذج اللوغاريتمي لتنظيم الرتب US)‏ يُعرف أيضا بنموذج 
Plackett-Luce‏ أو النموذج اللوغاريتمي الموسع أو تحليل 
المشترك الاختياري). 

التقدير الاحتمالي الملتوي. 

الانحدار اللوغاريتمي النمطي. 


404 


exlogistic 


glm 


glogit 
gprobit 
heckprob 
hetprob 


intreg 


ivprobit 
logistic 


logit 


mlogit 
nologit 
ologit 
oprobit 
probit 


rologit 


scobit 


slogit 
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81 الانحدار اللوغاريتمي مع بيانات Aud ja‏ استقصائية معقدة» كما 
يوجد كذلك العديد من أوامر الدراسات الاستقصائية (svy)‏ 
الخاصة بنماذج المتغيرات التصنيفية. (لمزيد من التفاصيل قم 
بطباعة .(help svy estimation‏ 

tobit‏ انحدار توبت Tobit‏ الذي يفترض أن بريتبع توزيع جاوس» 
ولكن يتم فحصه مسبقاً عند ALG‏ ثابتة معروفة. (للحصول 
على معلومات أكثر قم بطباعة الأمر .(help cnreg‏ 

xtmelogit‏ نماذج متعددة المستويات أو نماذج مختلطة لوغاريتمية ثنائية 
مع التأثيرات العشوائية أو الثابتة. للخصول على معلومات 
أكثر عن هذا الأمرء قم بطباعة xtmelogit‏ ماعط وسوف يتم 
شرح هذا الأمر لاحقا في الفصل (13). وهناك العديد من 
الأو امر الخاصة بالبيانات الطولية «(Panel Data)‏ وللحصول 
على قائمة بهذه.الأوامر قم بطباعة الأمر xt‏ ماعط. 

بعد الاطلاع على GUE!‏ أوامر النماذج» يمكن Glas predict OU‏ القيم 
المتوقعة أو الاحتمالات. كما يمكن للأمر predict.‏ عرض الإحصائيات 
التشخيصية مثل تلك التي سبق شرحها للانحدار اللوغاريتمي في دراسة 
Hosmer and Lemeshow‏ )2000( استخدام خيار معين مع الأمر predict‏ يعتمد 
على نوع النموذج المستخدم. هناك أمر يُستخدم بعد صياغة النموذج وهو 
الأمر predictnl‏ يقوم بحساب التوقعات غير الخطية وفترات ثقتها. (لمزيد 
من المعلومات قم بطباعة الأمر «(help predictnl‏ كما أن الأمر margins‏ 
والأمر marginsplot‏ من الأوامر المفيدة في هذا الصدد. 
هناك العديد من الأمثلة عن هذه الأوامر سوف يتم تناولها لاحقا في هذا 
الجزء. وعموما فإن الطرق المتعددة للنماذج Aye gill‏ أو المتغيرات Aa‏ 
المحدودة» يمكن الوصول إليها عن طريق استخدام عدد من قوائم ستاتا. وهذه 
القوائم تتضمن: 
Statistics < Binary outcomes‏ 
Statistics » Ordinal outcomes‏ 
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Statistics > Categorical outcomes 
Statistics > Generalized linear models 
Statistics > Longitudinal/panel data 
Statistics > Linear models and related 
Statistics > Multilevel mixed-effects models 


بعد الجزء التالي» سوف يتم التركيز في بقية هذا الفصل على de gone‏ 
مهمة من الطرق تسمى الانحدار اللوغاريتمي أو اللوجيستي. سوف نقوم 
بإلقاء نظرة سريعة على الطرق اللوغاريتمية الأساسية للمتغيرات التابعة ذات 
التصنيفات المتعددة والترتيبية والثنائية. الفصل (13) يقوم بشرح الشكل 
اللوغاريتمي لنماذج التأثيرات الثابتة. 


أمثلة عن الأوامر : Example Commands‏ 


.logistic y x1 x2 x3 
على‎ y(0.) يقوم بحساب الانحدار اللوغاريتمي للمتغير الثنائي‎ 
وتأثيرات المتغير التنبؤي يتم عرضها كنسب‎ ×3, ×2, x1 المتغيرات التنبؤية‎ 
الذي يقوم بحساب نفس‎ logit’ احتمالية» والأمر الأقرب للأمر أعلاه هو‎ 
ولكن يعرض التأثيرات كمُعاملات انحدار محتملة مسجلة.‎ oly a الانحدار‎ 
هي نفسهاء ولذلك فإن‎ logit والأمر‎ logistic والنماذج المحددة بالأمر‎ 
التوقعات والاختبارات التشخيصية سوف تكون متطابقة.‎ 
.estat gof 
المطابقة‎ uS يقوم هذا الأمر بحساب اختبار مربع كاي لبيرسون‎ 
للنموذج اللوغاريتمي وهو عبارة عن: مقارنة التكرارات المتوقعة مع‎ 
تم تعريفها بواسطة نمط المتغيرات‎ LOLS المحسوبة للمتغير 1 = رر باستخدام‎ 
عند وجود عدد كبير من أنماط المتغير فيمكننا وضع‎ «(x المستقلة (المتغير‎ 
estat. gof, هذه الأنماط في مجموعات حسب الاحتمالات المقدرة الأمر‎ 
يقوم بحساب الاختبار مع 10 مجموعات متساوية تقريبا.‎ group(10) 


.egtat classification 


Pd 
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يقوم بعرض الإحصائيات المصنفة وجدول التصنيفاتء الأمر 
estat classification‏ والأمر Iroc‏ والأمر Isens‏ (المعروضة an (ols‏ مفيدة 
عندما يكون هدف التحليل هو التصنيف. هذه الأوإمر جميعها تشير إلى 
النموذج اللوغاريتمي السابق. 
.lroc .‏ 
يقوم بإنشاء رسم بياني يوضح منحنى خاصية عمل المتلقي (ROC)‏ ويقوم 
بحساب المنطقة التي تقع تحت المنحنى. 
.lsens‏ 
يقوم بإنشاء رسم بياني للحساسية والخصوصية مقابل نقطة القطع 
الاحتمالي. 
.predict phat‏ 
يقوم بإنشاء متغير جديذ (تم تسميته عشوائياً باسم (phat‏ يساوي 
الاحتمالات المتوقعة التي فيها المتغير 1 = $us ull, y‏ على آخر نموذج 
لوغاريتمي. 
.predict dX2, dx2‏ 
يقوم بإنشاء متغير جديد (تم تسميته عشوائياً باسم o(dx2‏ الإحصائية 
التشخيصية تقوم بقياس التغير في اختبار مربع كاي لبيرسون من آخر تحليل 
لوغاريتمي 
emlogit y x1 x2 x3, base(3) rrr nolog‏ 
يقوم بحساب الانحدار اللوغاريتمي المتعدد لمخرجات متعددة للمتغير y‏ 
على ثلاثة متغيرات ox‏ الخيار base(3)‏ يقوم بتحديد أن 3 = ركتصنيف 
أساسي للمقارنة» والخيار rrr‏ يقوم بعرض نسب الخطر المتعلقة COLLA,‏ 
الانحدارء والخيار aig nolog‏ عرض سجل الاحتمال لكل تكرار. 
.Svy:mlogit y x1 x2 x3, base(3) rrr nolog‏ 
يقوم بحساب الانحدار اللوغاريتمي المتعدد الموزون للدراسات 
الاستقصائية: وهذا يتطلب أن تكون البيانات قد تم تعريفها مسبقا على أنها 
بيانات دراسة استقصائية باستخدام الأمر svyset‏ (انظر الفصل 4( الأشكال 
المختلفة لأوامر الدراسات الاستقصائيةء وأوامر الانحدار اللوغاريتمي 
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logit, ologit‏ وأوامر صياغة النماذج الأخرى لها نفس التركيبة تقريباً وتشبه 
نظيراتها الأخرى. 
.predict P2, outcome(2)‏ 
يقوم بإنشاء متغير جديد (تم تسميته عشوائيا باسم (P2‏ يمثل الاحتمال 
المتوقع عندما 2= ely y‏ على آخر تحليل تم إجراؤه بالأمر .mlogit‏ 


.glm successxl1 x2 x3,. family(binomial trials) 
eform 


يقوم هذا الأمر بحساب الانحدار اللوغاريتمي من خلال إنشاء نموذج 
خطي عام باستخدام جداول بدلا من المشاهدات الموجودة بالبيانات. المتغير 
success‏ يعطي عدد المرات التي ظهرت فيها المخرجات ذات العلاقة. Lid‏ 
المتغير rials‏ فيعطي aie‏ المرات التي كان يمكن أن تحدث لكل مجموعة 
من المتغيرات التنبؤية x2, x1‏ ,3×. ولذا فإن المتغيرين success/trials‏ سوف 
يساويان عدد المرات التي حدثت فيها المخرجات مثل احتمال تعافي 
المريض» الخيار eform‏ يعرض النتائج في شكل نسب مرجحة (شكل (e‏ 
بدلا من مُعاملات لوغاريتمية. 
بيانان dato‏ الفضاء : Space Shuttle Data‏ 


المثال الأول في هذا الفصل» يتضمن بيانات موجودة بالملف «shuttle dia‏ 
وهو يحتوي على بيانات تاريخية تغطي أول 25 رحلة لمكوك الفضاء 
الأمريكي. هذه البيانات تتضمن دليل أنه إذا تم تحليل البيانات بطريقة 
صحيحة؛ فإن النتائج يجب أن تظهر بأن موظفي وكالة ناسا يُفترض eed‏ لم 
يُطلقوا مكوك الفضاء تشالنجر في رحلته المميتة في سنة 1985 (الرحلة 25 
لمكوك الفضاء والتي كانت تحمل رقم 51-1 (STS‏ البيانات تم الحصول 
عليها من تقرير رئيس لجنة التحقيق في حادثة مكوك الفضاء تشالنجر في 
سنة 1986( ومن كتاب Tufte‏ (1997).» هذا الكتاب يتضمن نقاشا رائعا حول 
البيانات وقضايا التحليل. تعليقات Tufte‏ بشأن رحلات فضائية محددة تتضمن 
متغيرا Gras‏ في هذه البيانات. 


.use C:\data\shuttle.dta, clear 
. describe 
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Contains data from C:\data\shuttle.dta 





obs: 25 First 25 space shuttle flights 
vars: 8 2 Jul 2012 06:11 

size: 1,575 

storage display value 

variable name type format label variable label 
flight byte $6.0g flbl Flight 
month byte $8.0g * Month of launch 
day byte 58 . 0 Day of launch 
year int $8.0g Year of launch 
distress byte $8.0g 01251 Thermal distress incidents 
temp byte %B.0g Joint temperature, degrees F 
damage byte 59 و0.‎ Damage severity index, Tufte 1997 
comments str55 5 Comments, Tufte 1997 


Sorted by: flight 


list flight-temp, sepby ( year) 


flight month day year distress temp 


worn 


10. STS_41-B 


11. STS_41-C 
12. STS_41-D 
13. STS 41-G 


14. STS. 51-A 
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هذا الفصل» يقوم باختبار ثلاثة متغيرات بملف البيانات shuttle.dta‏ هي: 


Sia distress‏ عدد "حوادث التلف الحراري" التي انفجر فيها الغاز 


الساخن أو تلف حراري في أغلفة الوصلات لصواريخ «gia‏ 
هذا التلف في أغلفة الوصلات في صواريخ الدفع ساهمت 
بدرجة كبيرة بحادثة تشالنجرء وقد cule‏ العديد من الرحلات 
الفضائية السابقة من تلف أقل خطورة: لذلك كان من المعروف 
أن أغلفة الوصلات هي مصدر خطر محتمل. 


à da حرارة الوضلات: 'المحسبوبة عند الإظلاق‎ ia ji femp 


بالفهرنهايت. درجة الحرارة تعتمد بشكل كبير على درجة 
حرارة الجوء حيث إن وصلات صواريخ الإطلاق المطاطية 
الدائرية تصبح أقل مرونة في البرودة. 

متغير التاريخ وهي مقاسة بالأيام التي انقضت بعد 1 يناير 
0 المتغير date‏ عبارة عن شهر ويوم وسنة الإطلاق 
باستخدام الدالة mdy‏ (شهر > يوم - سنة للزمن المنقفضي؛ 
لمزيد من التفاصيل قم بطباعة .(help dates‏ 


generate date = mdy(month, day, year) 
-format %td date : 


date 


-label variable date "Date (days since 1/1/60)" 


التواريخ المنقضية مهمةء GY‏ العديد من التغيرات خلال فترة برنامج 


الرحلات الفضائية ربما أصبحت أكثر خطورة بمضي الزمن. حيث إن 
Pales dai ss‏ الإطلاق أصبحت Keu JÍ‏ لتوفير مساحة وزيادة الحمولة. 
وإغلفة الوصلات تم اختبارها تحت ضغط أعلى. بالإضافة إلى ذلك» فإن 
أجهزة المكوك الفضائي القابلة لإعادة الاستخدام تم صيانتهاء لذلك فإننا قد 
نتساءل: هل احتمال أن Gab‏ المصاحب لصواريخ الدفع (واحد أو JAS)‏ 
حادثة تلف حرآري) زادت مع تواريخ الإطلاق؟ 
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المتغير distress‏ تم توصيفه كمتغير رقمي. 


.tabulate distress 





Thermal 


distress 
incidents Freq. Percent Cum. 





في Babel)‏ فإن الأمر tabulate‏ يقوم بعرض توصيف القيمء والخيار 
nolabel‏ يوضح أن الرموز الرقمية التي تصف القيم: هي "none"‏ = 0 « ]"72 1 

2 - "3 plus” « or2" 
.tabulate distress, nolabel 


Thermal 
distress i 
incidents Freq. Percent Cum. 





يمكننا استخدام هذه الرموز لإنشاء متغير وهمي بأسم «any‏ هذا المتغير 
الذي يساوي 0 يمثل عدم حدوث أي مشاكل حراريةء و1 عند حدوث مشكلة 

حرارية واحدة أو أكثر كما يلي: 
-generate any = distress‏ 


¿replace any = 1 if distress == 
-label variable any "Any thermal distress’ 


لفحص ما I3‏ کان الأمر generate‏ والأمر replace‏ تم إنجازهما كما 
يجب» والتأكد بأن القيم المفقودة تم التعامل معها بشكل صحيح» قم بطباعة 
الأمر: 
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E T MM 


.tabulate distress any, miss 


Thermal 
distress Any thermal distress 
incidents 0 1 : Total 





نماذج الانحدار اللوغاريتمي تحدد كيف أن متغيرًا ثنائياً )0,1( مقل 
متغير amy‏ يعتمد على واحد أو أكثر من متغيرات ox‏ تركيبة الأمر logit‏ تشبه 
تركيبة الأمر cregress‏ وأغلب أوامر النماذج الأخرى مع متغير تابع يكقون 
في الأول. 


.logit any date 








Iteration 0 log likelihqod = -15.394543 
Iteration 1: log likelihood - -12.997472 
Iteration 2 log likelihood = -12.991097 
Iteration 3 log likelihood = -12.991096 
Logistic regression Number of obs = 23 
LR chi2 (1: = 4.81 
Prob > chi2 = 0.0283 
Log likelihood = -12 991096 Pseudo R2 = 0.1561 
any Coef. Std. Err. z P» |zl [95% Conf. Interval] 














.0020907 
-18.13116 






.0010703 
9.517253 


0.051 
0.057 






-6.94e-06 
-36.78463 


.0041884 


-1.94 .5223142 





الأمر logit‏ يكرر طريقة التقدير للوصول إلى الحد الأعلى من سجل دالة 
الاحتمال المعروضة في الجدول eta Je sll‏ أعلاه. عند التكرار 0 فإن 
سجل الاحتمال يشرح تناسب النموذج متضمناً ثابتا فقط. jl‏ سجل للاحتمال 


يشر ح تناسب النموذج النهائي. 


L= -18.13116 + 0.0020907date [9.1]‏ 
حيث إن : يمثل اللوغاريتم المتوقع أو سجل الترجيح لأي حادث تلف 
حراري: ر 


= In[P(any = 1( / P(any = 0)] [9.2] 
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واختبار y!‏ عموماً في الجانب الأيمن العلوي يقوم بتقييم فرضية العسدم 
التي تفترض أن كل المُعَاملات في النموذج تساوي صفرا! باستثناء الثابت. 
C= (In 4 -mA [9.3]‏ 
حيث إن 7 تمثل الاحتمال المسجل الأولى أو التكراري 0 (نموذج مع 
ثابت فقط) In Fy‏ تمثل الاحتمال المسجل للتكرار النهائي» حيث يمكن كتابة 
المعادلة كما يلي: 
X = -2]-15.394543-)-12.991096([‏ 
4.81— 
احتمال الحصول على قيمة أكبر ل مع درجة حرية تساوي 1 (الفرق 
في التعقيد بين النماذج الأولية والنهائية) احتمال منخفض Ley‏ فيه الكفاية 
)0.0283( لرفض فرضية العدم في هذا المثال. وبالتالي» فإن المتغير data‏ 
ليس له تأثير ذو معنوية إحصائية. 
بالرغم من انخفاض دقتها وسهولتهاء فإن الاختبارات التي يوفرها z‏ 
(الاعتدال المعياري) إحصائيات تم عرضها مع نتائج dogit‏ مع وجود متغير 
تنبؤي واحد وهو إحصائية ‏ للمتغير التنبؤي واحصائية y‏ تختبر الفرضيات 
المكافئةء فإن هذا الوضع يشبه تماما إحصائيات اختبارات rs F‏ في انحدار 
5 البسيطء (ule y‏ خلاف نظائر OLS‏ فإن تقريب z‏ اللوغاريتمي» واختبارات 
2 أحيانا لا تتفق (وكذلك «(gas‏ اختبار ‏ يكون صالحا بشكل عام. 
مشابهاً لبعض طرق الاحتمال ببرنامج ستاتاء فإن الأمر logit‏ يعرض 
محدد R‏ وهمي كما يلي: 
]9.4[ بك -InG/ In‏ 1 = ۸ الوهمي 
وفي هذا call‏ فإن المعادلة أعلاه ستكون: 
)15.394543-( / (12.991096-) — 1 = ”۸ الوهمي 
| 0.1561 = 
بالرغم من أن إحصائيات R‏ الوهمية تعتبر طريقة سريعة لوصف 
ومقارنة مدى تناسب النماذج المختلفة لنفس المتغير التابعء إلا أنها تفتقر إلى 
التفسير الواضح للتباين بالنسبة ۸ الحقيقية في تحليل انحدار LOLS‏ 
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بعد التحليل باستخدام الأمر cogit‏ فإن استخدام الأمر predict‏ (بدون 
إضافة أي خيارات) يُمكننا من الحصول على الاحتمالات المتوقعة. 
Phat = 1 / )1 e^) [9.5]‏ 

عند إنشاء رسم بياني للاحتمالات المتوقعة مع المتغير «date.‏ فإن 

المنحنى اللوغاريتمي سوف يكون على شكل حرف WY 6S‏ قمنا بتحديد 

الخيارات lia format %td date‏ بعد أن Lid‏ بتعريف المتغير «date‏ القيم تم 

توصيفها بشكل مناسب في المحور الأفقي أو محور الزمن في الشكل )1.9( 

.predict Phat 

.label variable Phat "Predicted P(distress »- 1)' 


.graph twoway connect Phat date, xtitle("Launch 
date") sort 


1) 
8 


6 


Predicted P(distress <: 
4 





" > H x 

01jan1981 01jan1982 01jan1983 01jan1984 01jan1985 01jan1986 
Launch date 
(1.9) الشكل‎ 


مُعَامل الأمر logit‏ في هذا المثال )0.0020907( يصف تأثير المتغير 
date‏ على الاحتمالات اللوغاريتمية لوقوع حوادث التلف الحراري؛ كل يوم 
إضافي يزيد من الاحتمالات اللوغاريتمية المتوقعة للتلف الحراري بقيمة 
7 وبعبارة أخرى يمكننا القول إن كل يوم إضافي يضاعف 
الاحتمالات اللو غاريتمية المتوقعة للتلف الحراري بقيمة 1.23-!(7777), 
(2.71828 م الرقم الأساسي للوغاريتم الطبيعي)؛ ويمكن لبرنامج ستاتا Bis‏ 
المعاملات بعد كل عملية «alas‏ وذلك بإضافة b[varname]‏ كما يلي: 
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.display exp (_b [date] ) 
1.0020929 

.display exp (_b [date] ) ^100 
1.2328 


يمكننا ببساطة إضافة الخيار or‏ (النسبة الاحتمالية) مع سطر الأمر 
cogit‏ الطريقة الثالثة للحصول على النسب الاحتمالية تتم عن طريق الأمر 
clogistic‏ وسيتم شرحها في الجزء التالي. الأمر logistic‏ يتناسب بالضبط مع 
نفس النماذج التي يتناسب معها الأمر cogit‏ ولكن الوضع الافتراضي لجدول 
مخرجاته يعرض النسب الاحتمالية بدلا من عرض المُعاملات. 
استخدام Jus‏ اللوغاريتهي : Using Logistic Regression‏ 


الأمر أدناه هو نفس تحليل الانحدار الذي قمنا به سابقاًء ولكن باستخدام 
الأمر logistic‏ بدلا من الأمر logit‏ 
.logistic any date‏ 


Logistic regression Number of obs = 23 
LR chi2(1) = 4.81 
Prob > chi2 = 0.0283 
Log likelihood = -12.991096 Pseudo R2 = 0.1561 








Odds Ratio Std. Err. z P»|z| [95$ Conf. Interval] 






1.002093 
1.34e-08 


.0010725 
1.27e-07 


1.95 
-1.91 


0.051 
0.057 


.9999931 
1.06e-16 


1.004197 
1.685925 



















a Vas op و اكات‎ dut Js UC CCS I abes A a cass 
القيم‎ «(e^ يعرض النسب الاحتمالية‎ logistic عرض المُعاملات فإن الأمر‎ 
oo أعلاه‎ logistic لجدول مخرجات الأمر‎ Odds Ratio SE المعروضة‎ 
عبارة عن أرقام» وهذه الأرقام هي احتمالات وكل زيادة في الاحتمال بمقدار‎ 
وحدة واحدة يؤدي إلى زيادة في المتغير × (إذا كانت قيم متغيرات × الأخرى‎ 
ثابتة).‎ 


والإحصائيات ذات العلاقة بطباعة الأمر التالي: 
.estat class‏ 





416 الإحصاء مع برنامج ستاتا 





Logistic model for any 


Classified 





Classified + if predicted Pr(D) >= .5 


True D defined as any != 0 

Sensitivity )عط‎ +| D) 85.71% 
Specificity . )عم‎ -|-D) 55.568 
Positive predictive value Pr( D| +( 75.00% 
Negative predictive value Pr(~D| -) 71.43% 
False + rate for true ~D )عم‎ +|~D) 44.44% 
False - rate for true D Pr( -| D) 14.29% 
False + rate for classified + Pr(~D| +) 25.008 
False - rate for classified - )عمط‎ D| -) 28.578 


Correctly classified 73.91% 





الوضع الافتراضي estat class OU‏ أن يقوم باس تخدام احتمال 0.5 
كنقطة قطع (ويمكننا تغييره بإضافة الخيار «(cutoffO‏ الرموز التي تظهر في 
جدول التصنيف أعلاه لها المعاني التالية: 

D‏ وقوع الحدث موضع الدراسة (وهذا يعني 1 (v=‏ لتلك المشاهدة وفي هذا 
المثال D‏ تشير إلى وقوع تلف حراري. 

-D‏ عدم وقوع الحدث موضع الدراسة (وهذا يعني 0 = (y‏ لتلك المشاهدة» وفي 
هذا المثال D‏ - ترتبط بالرحلات التي لم يحدث فيها تلف حراري. 

+ الاحتمال المتوقع للنموذج أكبر من أو يساوي نقطة quail‏ وحيث إننا 
استخدمنا نقطة القطع الافتراضية» فإن علامة + هنا تشير إلى أن النموذج 
يتوقع 0.5 أو أكبر لاحتمال التلف الحراري. 

- الاحتمال المتوقع أقل من نقطة القطعء وهنا علامة - تعني أن الاحتمال 
المتوقع call‏ الحراري JË‏ من 0.5. 
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ولذلك فإن 12 رحلة وتصنيفاتها كانت دقيقة في سياق أن النموذج قام 
بتوقع 5 من احتمال التلف الجرازي.وهذا:وقع بالفعل: وبالنسبة لبقية 5 
رحلات»› فإن النموذج يتوقع أقل من 5 من احتمال التلف الحراري وهذا لم 
DICTO‏ وبصفة عامة»ء فإن معدل التصنيف الصحيح يكون 5+12 = 17 
رحلة من أصل 23 رحلة أو .]9673.9 كما أن الجدول يعرض الاحتمالات 
المشروطة مثل الحساسية أو نسبة المشاهدات التي تكون فيها 0.5 < P‏ مع 
ملاجظة حدوث التلف الحراري )12 من أصل 14 أو %85.71( 
بعد استخدام الأمر logistic‏ أو الأمر 4 يمكننا استخدام الأمر predict‏ 
لحساب توقعات متعددة وإحصائيات تشخيصية أخرىء يمكن الحصول على 
Hosmer and Lemeshow‏ (2000). 
predict newvar‏ الاحتمال المتوقع الذي يكون فيه 1= ر 
predict newvar, xb‏ الاحتمال الخطي (احتمالات لوغاريتمية متوقعة 
يكون فيها 1 = ) 
predict newvar, stdp‏ الخطأ المعياري للتنبؤ الخطي. 
AB predict newvar, dbeta‏ تأثير الإحصائيات وهو Bla‏ مسافة كوك 


Cook's D 
X. لنمط المتغير‎ jth الانحراف المتبقي للمشاهدة‎ predict newvar, 
d, وهو‎ deviance 
J 
A 7 يمكن كتابته‎ silly لبيرسون‎ y! التغير في‎ predict newvar, 2 
A xs أو‎ 
A أو‎ AD ويمكن كتابته‎ y التغير في انحراف‎ predict newvar, 
Y ddeviance 
ويكون‎ x المتغير‎ lai على‎ jth تأثير المشاهدة‎ predict newvar, hat 
h; هو‎ 


Ù تكو‎ "us x تخصيص ارقام لأنماط المتغد‎ predict newvar, 
F132, 3st number 
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x لنمط المتغير‎ jth باقي بيرسون للمشاهدة‎ predict newvar, resid 
rj وهذا الباقي هو‎ 


sisal © aL predict newvar, 
pre بيرسون‎ ut rstandard 


rae Jd predict newvar, score‏ من الاحتمال اللو غاريتمي مع الأخذ 
بالاعتبار Xb‏ 
الإحصائيات التي يتم الحصول عليها عن طريق اس تخدام 
dbeta, dx2, ddeviance, hat jui!‏ لا تقوم بقياس تأثير كل مشاهدة على 
حدة كما تفعل نظائرها في تحليل الانحدار العاديء Lally‏ تقوم بقياس تأثير 
أنماط المتغيرات المستقلة, وبالتالي فهي تستبعد المشاهدات التي تحتوي على 
مجموعة خاصة من قيم ×. لمزيد من المعلومات انظر Hosmer and 4 ya‏ 
Lemeshow‏ (2000). 
هل صواريخ الدفع مع درجة الحرارة lee‏ يؤثران على احتمال حدوث 
الحرارة temp‏ كمتغير تنبؤي ثان. 


.logistic any date temp 


Logistic regression Number of obs = 23 
LR chi2(2) = 8.09 
Prob > chi2 = 0.0175 
Log likelihood = -11.350748 Pseudo R2 = 0.2627 








Odds Ratio Std. Err. z P»|z| [95$ Conf. Interval) 





















1.00297 .0013675 1.000293 1.005653 
.8408309 .0987887 -1.48 0.140 .6678848 1.058561 
1.19e-06 .0000121 2.40e-15 587.9723 


تضمين درجة الحرارة كمتغير تنبؤي طور بشكل جزئي معدل التصنيف 
الصحيح ليكون 5678.26 


-estat class 
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Logistic model for any 


Classified 





Classified + if predicted Pr(D) >= .5 


True D defined as any != 0 

Sensitivity Pr( «| D) 85.71% 
Specificity Pr( -|~D) 66.67% 
Positive predictive value )عط‎ D| +) 80.00% 
Negative predictive value Pr(-D| -) 75.00% 
False + rate for true ~D Pr( +|~D) 33.33% 
False - rate for true D Pr( -| D) 14.298 
False + rate for classified + Pr(-D| +( 20.00$ 
False - rate for classified - Pr( D| -) 25.00% 
Correctly classified 78.26% 


حسب النموذج أعلاه» فإن زيادة درجة الحرارة درجة Aa ia‏ واحدة 
يُضاعف احتمالات تلف صواريخ الدفع بمقدار 0.84 بعبارة أخرى» كل 
نقص في درجة الحرارة بمقدار درجة مئوية واحدة يقلل احتمالات التدف 
بمقدار %16؛ بالرغم من أن هذا التأثير يبدو قويا بما فيه الكفاية ليُثير 
الاهتمام» فإن اختبار z‏ يوضح بأن هذا الاحتمال ليس ذا معنوية إحصائية 
«(z=-1.476, p=0.140)‏ والاختبار الآخر الحاسم يتم باستخدام نسبة الاحتمال 
لاختبار o?‏ الأمر Irtest‏ يقوم بمقارنة نماذج متداخلة يتم تقديرها باستخدام 
الأرجحية العظمى؛ حيث يتم أولا تقدير النموذج بالكامل بما في ذلك كل 
المتغيرات ذات العلاقة كما تم فعله سابقا مع الأمر logistic any date temp‏ ثم 
بعد ذلك نقوم بطباعة الأمر estimates store‏ يليه.إأسم (بافتراض أن الاسم هو 
(full‏ لتحديد النموذج الأول: 

.estimates store full 

الآن نقوم بتقدير النموذج المصغر (silly‏ يتضمن فقط مجموعة من 
متغيرات × التي توجد في النموذج الكامل أعلاه (يُطلق على مثل هذه النماذج 
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المصغرة اسم النماذج المتداخلة)ء وأخيرا استخدام Irtest full Jia yal‏ يقوم 

بإجراء اختبار للنموذج المتداخل مع النموذج السابق والذي قمنا بتسميته full‏ 

فعلى سبيل المثال» Gad)‏ باستخدام quietly‏ قبل الأمر logistic‏ أدناه لأننا 
شاهدنا المخرجات من قبل). 

-quietly logistic any date 

.lrtest full 


Likelihood-ratio test LR chi2(1) = 3.28‏ 
(Assumption: . nested in full) Prob » chi2 - 0.0701‏ 
الأمر Irtest‏ يقوم باختبار آخر (يفترض أنه متداخل) نموذج مع النموذج 
الذي سبق حفظه بواسطة الأمر estimates store‏ وهو يستخدم إحصائية 
اختبار عامة لنماذج الأرجحية العظمى المتداخلة. 
-2(In K - mA) [9.6]‏ =£ 
حيث إن In o6‏ الاحتمال اللوغازيتمي المتوقع للنموذج الأول e)‏ كل 
متغيرات In 7 «(x‏ الاحتمال اللوغاريتمي المتوقع للنموذج الثاني )—& 
مجموعة محددة من متغيرات x‏ فقط)» قارن إحصائيات الاختبار الناتجة مع 
المستبعدة) بين النماذج 1 ,0 لمزيد من المعلومات حول هذا الأمر قم 
بطباعة Irtest‏ ماعط « وهذا الأمر يعمل مع أي حسابات لتقدير الأرجحية 
العظمى ببرنامج ستاتا (هذه الأوامر مثل logit, mlogit, stcox‏ والعديد من 
الأوامر الأخرى). وبصفة dale‏ فإن إحصائية # يتم حسابها باس تخدام 
مخرجات الأمر logit‏ أو الأمر logistic‏ (المعادلة رقم [9.3]) وخصوصا 
المعادلة رقم ]9.6[- 
الأمر Irtest‏ في المثال السابق يقوم بإجراء العملية الحسابية التالية: 
X = -2[-12.991096 — (-11.350748)]‏ 
3.28= 
مع درجة حرية 1 سوف يكون p = 0.0701 Ul‏ وتأثير المتغير aig‏ 
ذي معنوية إحصائية عند 0.10 = «a‏ وبالأخذ في الاعتبار uil‏ نفوم باس تخدام 
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عينة صغيرة الحجم والتأثيرات السلبية المحتملة للخطأ من النوع الثاني 
بخصوص السلامة بالمركبة الفضائية فإن 0.10 = a‏ يبدو أنها A hä‏ تحول 
أكثر دقة من المعتاد عندما تكون 0.05 -». 


الرسم البياني Gls‏ اطشروطة أو الهامشية : 
Marginal or Conditional Effects Plots‏ 
إنشاء رسم بياني للتأثيرات المشروطة أو الهامشية المعدلة يساعد في فهم 
وتوصيل معنى النموذج اللوغاريتمي وتطبيقاته على الاحتمالات. فمثلاً يمكننا 
حساب الاحتمال المتوقع لحوادث التلف الحراري كدالة للمتغير temp‏ مع 


الحفاظ على المتغير aie date‏ قيم منخفضة (في البداية) أو مرتفعمة (في 
النهاية) نسبيا. 


. summarize date temp 


Variable Obs Mean Std. Dev. Min Max 





date 25 8905.88 517.6033 7772 9524 
` temp 25 68.44 10.52806 31 81 


التواريخ الماضية في هذا المدى من البيانات من أول رحلة للمكوك 
الفضاء في 12 أبريل 1981 )7772 = (date‏ إلى تاريخ كارثة تشالنجر في 21 
يناير 1986 )9524 = «(date‏ درجات الحرارة تتراوح ما بين 31 إلى 81 
درجة فهرنهايتيةء الأمر margins‏ يمكنه إجراء الحسابات» بينما الأمر 
marginsplot‏ يمكنه إنشاء الأشكال البيانية للتوقعات المحتملة للنموذج الذي تم 
الحصول Ade‏ :من GAN‏ ابوه عند Bale)‏ درجة cis s 10 Sol gall‏ عند 

تواريخ البداية والنهاية. 
.quietly logistic any date temp‏ 


.margins, at(temp = (30(10)80) date = (7772 
9524)) vsquish 
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LLL OE‏ بي ا ا 


Adjusted predictions Number of obs z 23 
Model VCE : OIM 
Expression : Pr(any), predict () 
1. .at : date z 7112 
temp = 30 
2..at : date z 7712 
temp = 40 
3. at : date = 7772 
temp = 50 
4. at : date z 7112 
temp = 60 
5. at : date = 7772 
temp = 70 
6._at : date = 7772 
temp = 80 
7. at : date = 9524 
temp = 30 
B. at : date = 9524 
temp = 40 
9. at : date = 9524 
temp = 50 
10._at : date = 9524 
temp = 60 
11.. at : date = 9524 
temp = 70 
12. at : date = 9524 
temp = 80 










Delta-method 
Margin Std. Err. z P»|z] (95% Conf. Interval) 













at 

1 .985239 .0624661 15.7Y 0.000 .8628077 1.10767 
2 .9218137 .2310152 3.99 0.000 .4690321 1.374595 
3 .6755951 . 4831333 1.40 0.162 -.2713288 1.622519 
4 .2689325 .291999 0.92 0.357 --.3033749 . 84124 
5 .0610143 .0871295 0.70 0.484 -.1097563 .2317849 
6 .0113476 .0255353 0.44 0.657 -.0387006 .0613958 
7 .9999169 .0004545 2200.25 0.000 .9990262 1.000808 
8 .99953 .0020277? 492.94 0.000 .9955558 1.003504 
9 -9973449 .0084046 118.67 0.000 .9808722 1.013818 
10 .9851528 .0302581 32.56 0.000 .9258479 1.044458 
11 .9213867 .0808455 11.40 0.000 .7629324 1.079841 
12 -6742985 .2166156 3.11 0.002 .2497398 1.098857 





-marginsplot 
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Adjusted Predictions with level(95)% Cls 


Pr(Any) 


30 40 50 60 70 80 
Joint temperature, degrees F 


[—— date=12apr1981 لهل‎ 6 | 


الشكل )2.9( 


الوضع الافتراضي للأمر marginsplot‏ بالشكل )2.9( يوضح المعلومات 
الأساسيةء ولكنه ليس بالتنسيق المطلوب. وللحصول على شكل أكثر قبولا 
للنشرء يمكننا منع ظهور فترات الثقة عن طريق الخيار noci‏ ونقل مربع 
شرح الرسم واستخدام الخيار plotHopts)‏ لإظهار المنحنيين وإضافة عنوان» 
أولاً سوف نقوم باستخدام الأمر margins‏ مع زيادة درجة الحرارة درجة 
واحدة» وهذه الزيادة سوف تجعل المنحنيات الناتجة أكثر تجانسا. 
.quietly margins, at(temp = (30(1)80) date =‏ 

(8000 9500)) 


-marginsplot, noci legend(position(7) ring(0) 
rows (2) ) 

plotiopts(msymbol(i) lpattern(dash) 

lwidth (medthick) ) 

plot2opts(msymbol(i) lpattern(solid) 

lwidth (medthich)) 


title("Predicted probability of booster O-ring 
damage") 
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جي ت cul tte‏ سات 


Predicted probability of booster O-ring damage 





===>" date=26nov1981 BL 
date=04jan1986 | T 





30 40 


50 60 70 80 
Joint temperature, degrees F 


الشكل )3.9( 


بناء على نموذجنا اللوغاريتمي» فإنه بالقرب من وقت البداية á la J‏ 
مكوك الفضاء (المنحنى المتقطع في الشكل أعلاه) احتمال التلف الحراري 
يتجه من القرب من الصفر عند درجة حرارة 80 °F‏ إلى أقل من 40 °F‏ 
ly‏ وبحلول وقت رحلة تشالنجر (المنحنى المتصل في الشكل أعلاه). فإن 
احتمال أي تلف حراري يزيد We‏ 0.6 حتى في الأجواء yl‏ 6$ ويصل إلى 
1 في الرحلات التي تكون فيها درجة الحرارة 70 OF‏ ويجب ملاحظة أن 
درجة الحرارة الفعلية لمكوك الفضاء تشالنجر عند الإطلاق كانت 31 *F‏ 
والتي يمكن وضعها في أعلى اليسار بالشكل (3.9). 
الرسومات aulull‏ التشخيصية والاحصائيات التشخيصية: 


Diagnostic Statistics and Plots 
كما أشرنا سابقاء فإن.تأثير الانحدار اللوغاريتمي والإحصائيات‎ 


التشخيصية التي يمكن الحصول عليها عن طريق استخدام الأمر Y predict‏ 
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OLS lous‏ في لفطك )7( ld eel a Vary‏ الشخيصات: ias Me gl‏ 
تشير إلى أنماط متغيرات ox‏ وفي بيانات مكوك الفضاء فإن كل نمط لمتغير v‏ 
لا نظير له» حيث لا as‏ رحلتان تشتركان في نفس التاريخ date‏ ودرجة 
الحرارة remp‏ (وهذا طبيعي حيث لم يتم إطلاق رحلتين في نفس اليوم)ء 
وقبل استخدام الأمر predict‏ سوف تقوم بإعادة حساب آخر نموذج. 


quietly logistic any date temp 

.predict Phat3 

.label variable Phat3 "Predicted probability' 
‘predict dX2, dx2 

-label variable dX2 "Change in Pearson chi- 
squared" 

.predict dB, dbeta 

.label variable dB "Influence" 

-predict dD, ddeviance 

-label variable dD "Change in deviance' 


تشير دراسة Hosmer and Lemeshow‏ )2000( إلى أن الرسومات البيانية 
تساعد في قراءة الإحصائيات التشخيصية» ولإنشاء رسم بياني للتغير في xi‏ 
لبيرسون مع احتمال التلف الحراري (الشكل 4.9) نقوم بطباعة الأمر التالي: 
.graph twoway scatter dX2 Phat3‏ 


4 6 8 10 


Change in Pearson chi-squared 


2 





4 6 
Predicted probability 


الشكل )4.9( 
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هناك نمطان اثنان للمتغيرات + يتناسبان بشكل ضعيف وهذا واضح في 
أعلى اليمين واليسار بالشكل (4.9) حيث تبرز هاتان النقطتان بوضوح. 
يمكننا تحديد الرحلات التي لها قيم 4×2 مرتفعة بالعين المجردة من خلال 
إضافة توصيف لنقاط الانتشاربالرسم البياني. (في هذا المثال» سوف نستخدم 
رقم الرحلة fight‏ للتوصيف).؛ في الشكل )5.9( سوف يتم توصيف الرحلات 
التي يكون فيها 2 cli dX2»‏ وذلك بوضع هذه التوصيفات فوق شكل 
الانتشار (إذا Lied‏ بإضافة توصيفات لكل النقاط بالرسم البيانيء فإننالن 
نستطيع قراءة الجزء السفلي من البيانات التي تكون فيها النقاط متقاربة). 

.graph twoway scatter dX2 Phat3 

|| scatter  dx2  Phat3 if  dx2» 2, 

mlabel(flight) 


mlabsize(medsmall) 
|| , 1egend(of£) 


10 


®STS-2 


8 


6 


@STS_51-A 


Change in Pearson chi-squared 
4 


2 


eSTS 51-J 





a. 
eo ee See 





4 6 
Predicted probability 
(5.9) الشكل‎ 


.list flight any date temp dX2 Phat3 if dx2> 2 


الفصل التاسع : الانحدار اللوغاريتمي 427 


2 STS-2 12nov1981 9.630337 .1091805 
4. STS-4 : 27jun1982 2 .0407113 
14. STS 51-A 08nov1984 5.899742 .8400974 
21. 585-51-3 030ct1985 2.124642 - 6350927 
25. STS 51-L . 28jan1986 . .9999012 





الرحلة 51-4 SAS‏ لم تعان من أي تلف حراري بالرغم من تأخر تاريخ 
إطلاقهاء وانخفاض درجة الحرارة (انظر الشكل 2.9(« النموذج يتوقع أن 
4 احتمال وقوع تلف حراري لهذه الرحلة. كل النقاط التي تقع في 
الجانب الأيمن بالشكل )5.9( لم تعان من أي تلف (any = 0) qs JI os‏ ولكن 
في أعلى اليسار )1 = (any‏ الخاصة بالرحلة STS-2‏ عانت من تلف حراري 
بالرغم من أنها واحدة من الرحلات الأولى؛ وتم إطلاقها في جو caine‏ 
النموذج يتوقع بأن 0.109 احتمال وقوع تلف» وحيث إن ستاتا يعتبر القيم 
المفقودة أعلى قيم» فإنه يقوم بؤضع القيمتين المفقودتين للرحلات بما فيها 
رحلة تشالنجر ضمن نطاق البيانات 2 dX2»‏ 

نفس النتائج تم الحصول عليها من الرسم البياني للمتغير dD‏ مع 
الاحتمال المتوقع كما هو معروض في الشكل (6.9). ومرة as dl‏ فإن 
الرحلتين 5715-2 (أعلى اليسار) و51-4 STS‏ (أعلى اليمين) تبرزان وتتناسبان 
بشكل ضعيف مع النموذج» الشكل )6.9( يوضح التباين في شكل الانتشار 
للنقاط التي تم توصيفهاء Yang‏ من وضع رقم الرحلة بالقرب من النقاط كما 
فعلنا في الشكل (5.9) سوف نقوم بإخفاء النقاط نفسها عن طريق الخيار 
msymbol(i)‏ ونضع توصيفات في مكان النقاط عن طريق الخيار 
mlabposition(0)‏ لكل نقطة بيانات في الشكل (6.9). 


-graph twoway scatter dD Phat3, msymbol(i) 
mlabposition(0)mlabel(flight) mlabsize(small) 
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Ge, A ا‎ 5 o M ا‎ 








STS 51.A 


hd 
E: 
a” 
D 
£ STS 51-J 
= X 
e 
P STS 51-F 
o STS$rs-9 


STS_41-G 


SBA 


ST& 544 
acc 


1 & 4 
Predicted probability‏ 
الشكل )6.9( 
المتغير 48 يقوم بقياس تأثير نمط متغير × في الانحدار اللوغاريتمي. 
دوائر حسب تأثيرها. الشكل يوضح بأن هناك مشاهدتين هما أسوأ المشاهدات 
وهما الأكثر تأثيرا. 


-graph twoway scatter dD Phat3 [aweight = dB], 
msymbol (oh) 


Change in deviance 





4 8 
Predicted probability 


الشكل )7.9( 
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المشاهدات التي تتناسب بشكل ضعيف ولها تأثير كبير تستحق عناية 
خاصة لأنها تتعارض مع النمط العام للبيانات والنموذج المستخرج يتوقع 
اتجاهها المختلف» وبالطبع فإن استبعاد مثل تلك القيم المتطرفة يسمح لنا 
بالحصول على نموذج أكثر تناسبا مع بقية البيانات» ولكن هذا ما تعرضه 
الأشكال الدائرية cau dl‏ ردة الفعل الأكثر قبولاً هو التحقق من سبب ظهور 
القيم المتطرفة فلماذا رحلة مكوك الفضاء STS-2‏ وليست الرحلة STS 51-A‏ 
عانت من تلف أثناء الإطلاق؟ البحث عن إجابة لهذا السؤال قد تقود المحققين 
إلى النظر في المتغيرات السابقة. 
الانحدار اللوغاريئمي مع الفئة اطرئبة y‏ : 
Logistic Regression with Ordered-Category y‏ 
الأمر logit‏ والأمر logistic‏ يتناسبان مع نماذج لها متغيرات» وهذه 
المتغيرات لها نوعان من المخرجات يتم ترميزهما 0 ly‏ ونحن نحتاج إلى 
طرق أخرى للنماذج التي يأخذ فيها المتغير بر أكثر من قيمتين. الاحتمالان 
المهمان هما الانحدار اللوغاريتمي المتعددء أو المرتب: 
60814 الانحدار اللوغاريتمي المتغدد: الذي يكون فيه المتغير برله فئات 
متعددة ولكنها غير مرتبة مثل )71 ديمقراطسي «Democrat‏ 2= 
جمهوري -(other có E =3 «Republican‏ 
ologit‏ الانحدار اللوغاريتمي المرتب: الذي يكون فيه المتغير y‏ متغيرًا 
Gus‏ (فئة مرتبة) القيم الرقمية تمثل فئات ليست ذات أهمية إلا إذا 
كانت الأرقام الأعلى تشير إلى الكثرة» مثلا فئات المتغير «رقد تشير 
إلى )1= سي <fairc) sie =2 «poore‏ 3= ممتاز (excellent‏ 
قمنا سابقاً بتحديد المخرجات الثلاثة للمتغير الترتيبي distress‏ في 
تفر عات للمتغير cany‏ الأمر logit‏ والأمر logistic‏ يتطلبان متغيرات تابعة لها 
قيمتان (0,1). ومن ناحية أخرىء فإن الأمر ologit‏ تم تصميمه للمتغيرات 
الترتيبية التي لها أكثر من قيمتين؛ دعنا نقول بأن المتغير distress‏ له عدة 
مخرجات هي 0- "لا شيء 1-"1 أو 2“ 2-"3 أو أكثر' وهي تشير إلى 
حوادث التلف بصواريخ الإطلاق. 


zu‏ الإحصاء مع برنامج ستاتا 





الانحدار اللوغاريتمي المرتب يشير إلى أن المتغير dare‏ والمتغير temp‏ 
كليهما يؤئر في المتغير distress‏ بنفس الإشارات (موجب لمتغير edate‏ سالب 
لمتغیر (temp‏ كما شاهدنا سابقا في التحليل اللوغاريتمي الثنائي: 


-ologit distress date temp, nolog 


Ordered logistic regression Number of obs = 23 
LR chi2(2) = 12.32 
Prob > chi2 = 0.0021 
Log likelihood = -18.79706 Pseudo R2 = 0.2468 















distress Coef. Std. Err. [95$ Conf. Interval) 


.003286 
- 2 


.0012662 
.0834475 


0.009 
0.038 


.0008043 
-.3369293 


.0057677 
-.0098212 

































16.42813 
18.12227 


9.554822 
9.722702 


-2.298978 
-.933092 






35.15524 
37.17763 







Jal ca Ao fst una qua ci Las!‏ اث Vol ody Jal z‏ وجح 
استخدام الأمر estimates store‏ مع النتائج المحفو ظة في Slall‏ $ من النموذج 
الكامل (مع متغيرين تنبؤيين) والذي تم حسابه سابقاء يمكننا إعطاء هذا 
النموذج أي اسم توصيفي وليكن اسمه date temp‏ 
.estimates store date temp‏ 
ثم بعد ذلك القيام بإنشاء نموذج AÍ‏ بساطة بدون المتغير temp‏ وحفظ 
نتائج النموذج notemp pub‏ وإجراء اختبار نسبة الاحتمال لمعرفة ما إذا كان 
النموذج notemp‏ يختلف بدرجة كبيرة عن النموذج الكامل date temp‏ 


.quietly ologit distress date 
.estimates store notemp 
-lrtest notemp date temp 


Likelihood-ratio test LR chi2(1) - 6.12 
(Assumption: notemp nested in date temp) Prob > chi2 = 0.0133 


وتجدر الملاحظة أن d Irtest jay a‏ يشيران إلى أن 
نموذج notemp‏ يتداخل مع نموذج edate remp‏ وهذا يعني أن المعلمات التي 
BEDS a Vid‏ 
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نموذج date. temp.‏ وكلا النموذجين تم تقديرهما من نفس مجموعة المشاهدات 
(والتي يمكن أن تكون معقدة عند احتواء البيانات على قيم مفقودة). اختيار 
الأرجحية العظمى يشير إلى أن نموذج noremp‏ يتناسب بشكل ضعيف جداء 
وحيث إن وجود المتغير temp‏ كمتغير تنبؤي في نموذج date temp‏ هو 
الاختلاف الوحيد لذلك» فإن اختبار الأرجحية العظمى يوضح Gb‏ مساهمة 
المتغير remp‏ في النتائج هي مساهمة GIS‏ أهمية كبيرة. وهناك خطوات 
أخرى مشابهة تؤكد بأن متغير date‏ له تأثير ذو معنوية. 

.quietly ologit distress temp 


.estimates store nodate 
.lrtest date temp: 


Likelihood-ratio test LR chi2(1) = 10.33 
(Assumption: nodate nested in date, temp) Prob > chi2 = 0.0013 


الأمر estimates store‏ والأمر Irtest‏ يعتبران أدو ات مرنة لمقارنة نماذج 
الأرجحية العظمى. وللحصول على مزيد من التفاصيل عن هذه الأوامر 
والخيارات المصاحبة لهاء قم بطباعة الأمر help Irtest‏ أو الأمر .help estimates‏ 


النموذج اللوغاريتمي المرتب يقوم بتقدير نتيجة 5 لكل مشاهدة حيث إن 
كل مشاهدة تكون Alla‏ خطية للمتغير date‏ والمتغير temp‏ 
S = 0.003286date — 0.1733752temp‏ 
الاحتمالات المتوقعة تعتمد على قيمة 5 زائدا الاضطراب المسوزع 
اللوغاريتمي cu‏ الاقتراب من نقاط القطع المقذرة (المعروضة في مخرجات 
الأمر ologit‏ باستخذام cut2 cutl‏ ... الخ). 
P(distress =“none”) = P(S+u< cutl)‏ 
exp(-cut! + S)y'‏ + 1( = 
P(distress = “1 or 2”) = P(cutl «S + u < cut2)‏ 
(I+ exp(-cut2 + 5))'0 (1 + exp(-cut1 + S))"‏ = 
P(distress = “3 plus”) = P(cut2 <S + u)‏ 
exp(-cut2 + S)’‏ + 1( 110= 
بعد إجراء حساب الاحتمالات المتوقعة باستخدام الأمر ologit‏ والأمر 
predict‏ لكل فئة من فئات المتغير call‏ نقوم بإعطاء أسماء لكل الاحتمالات 


aM‏ الإحصاء مع برنامج ستاتا 





التي تم حسابها بالأمر iad .predict‏ الاسم none‏ قد يشير إلى احتمال عدم 
وجود حادث تلف (الفئة الأو لى لحوادث التلف (distress‏ والاسم threeplus‏ 
يشير لثلاثة حوادث تلف أو أكثر (ثالث وآخر فئة لحوادث التلف (distress‏ 


.quietly ologit distress date temp 
.predict none onetwo threeplus 


هذا يقوم بإنشاء ثلاثة متغيرات جديدة: 


.describe none onetwo threeplus 


" storage display value 
variable name type format label variable label 
none float %9.0g Pr(distress--0) 
onetwo float %9.0g Pr(distress--1) 
threeplus float %9.0g Pr(distress--2) 


الاحتمالات المتوقعة لآخر رحلة لمكوك الفضاء تشالنجر - وهي 
المشاهدة رقم 25 ي هذه البيانات - متذبذبة. 
.list flight none onetwo threeplus if flight 2-25‏ 


flight none onetwo threep-s 


"25. STS 51-L .0000754 .0003346 .99959 





النموذج الذي قمنا بإنشائه يعتمد على تحليل 523 aas dia y Sus ais‏ 
مكوك تشالنجرء ويعطي احتمالاً ضئيلاً (0.000075 - م) بأن المكوك تشالنجر 
سوف لن يواجه halaa lib‏ للاتطلاق» واحتمال أكثر alla‏ بحادث أو اثنين 
(0.003 - م) ولكن الاحتمال الواضح والمؤكد )0.9996 = (p‏ لوقوع ADU‏ 
حوادث تلف أو أكثر. 

للحصول على مزيد من التفاصيل عن التقنيات المتعلقة بهذا النوع من 
التحليل» انظر دراسة Long‏ )1997( ودراسة Hosmer and Lemeshow‏ )2000( كما 
أن دليل المستخدم the Reference Manual‏ يشر ح تطبيقات برنامج ستاتا المتعافة 
بهذا الموضوع. بالإضافة إلى ذلك فإن دراسة Long and Freese‏ )2006( تعرض 
نقاشاً أكثر تفصيلاء وتشرح الخيارات المتوافرة عن القيام بهذا التحليل عن طريق 
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استخدام الملفات التنفيذية «do-files‏ كما توضح بعض التفسيرات المفيدة وأوامر مأ 
قبل التقدير مثل اختبارات (Brant‏ ولتثبيت هذه الأوامر التنفيذية المجانية من 
الإنترنت قم بطباعة الأمر findit brant‏ ثم اتبع الرابط الذي يرشدك إلى مصادر 
تلك الملفات التنفيذية. 
Jus M‏ اللوغارينهي اطتعدد : Multinomial Logistic Regression‏ 
المتعدد (يُسمى أيضا الانحدار اللوغاريتمي متعدد التدريج) يوفر أدوات 
مناسبة؛ فإذا كان المتغير «uU Ad y‏ فإن الأمر mlogit‏ والأمر ologit‏ كليهما 
يتناسب مع نفس النموذج كما يحدث مع الأمر logistic‏ إلا أن نموذج الأمر 
mlogit‏ أكثر تعقيدا. 

تظهر المتغيرات التابعة ذات الفئات المتعددة عادة في بيانات الدراسات 
الاستقصائية؛ فمثلا بيانات استقصاء جرانيت توضح ذلك. 


.use C:\data\Granite2011_6.dta, clear 
.describe age sex educ party warmop2 warmice 





storage display value 
variable name type format label variable label 
age byte $9.0g age Age of respondent 
sex byte $9.0g sex2 Gender 
educ byte $14.0g educ Highest degree completed 
party byte $11.0g party Political party identification 
warmop2 byte $9.0g yesno Believe happening now/human 
warmice byte %9.0g warmice2 Arctic ice vs. 30 years ago 


رأينا في الفصل )4( أن الاستطلاع يتضمن ثلاثة أسئلة رئيسة حول 
المنا € مثل المتعلقة بالمتغير twarmice‏ ش 
أي من العبارات الثلاث التالية تعتقد أنها أكثر دقة؟ 
خلال السنوات القليلة الماضيةء جليد القطب الشمالي في آخر فصل 
- غطى Uil‏ مساحة عن تلك التي كان يغطيها في السنوات 30 
الماضبة. l‏ 


- 
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— انخفض ولكنه عاد ليغطي نفس المناطق التي كان يغطيها في 30 
سنة الماضية. 
- يغطي مناطق أكثر من تلك التي كان يغطيها في 30 سنة الماضية. 
هذه البيانات تم اعتبارها بيانات دراسة استقصائية باستخدام الأمر svyset‏ 
(انظر الفصل 4(« وهذه البيانات توضح معلومات عن الأوزان cial y‏ 
والأوامر التي تستخدم قبلها ره سوف تقوم تلقائياً بتطبيق هذه المعلومات. 
فمثلاً نسب الردود الموزونة للمتغير warmice‏ تم الحصول عليها كما يلي: 


.Svy: tab warmice, percent 





(running tabulate on estimation sample) 









Number of strata z 1 Number of obs z 516 
Number of PSUS = 516 Population size = 515.57392 
Design df = 515 
Arctic 
ice vs. 
30 years 
ago percentages 
Less 
Recovere 10.43 
More 6.916 
DK/NA 11.75 
Total 5 
Key: percentages = cell percentages 


حوالي %71 من الذين شاركوا في الاستطلاع أجابوا بأن هناك انخفاضاً 
في جليد المنطقة الشماليةء وأن نسبة 9612 فقط قالوا بأنهم لا يعرفون أو لم 
يقوموا بالإجابة. 

المتغير الثاني الذي يهمنا يشير إلى ما إذا كان المشاركون في الدراسة 
يعتقدون بأن التغير المناخي يحدث في الوقت الحاضر وس ببه الأنشطة 
البشرية (warmop2)‏ حوالي %55 يعتقدون أن هذه العبارة صحيحة. 


عير 


:8vy: tab warmop2, percent 
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(running tabulate on estimation sample) 









Number of strata = 1 Number of obs = 516 
Number of PSUs = 516 Population size = 515.57392 
Design df = 515 
Believe 
happening 
now/human percentages 
Key: percentages = cell percentages 


إجابات السؤال المتعلق بالمتغير warmice‏ ترتبط مع الاعتقاد بوجود 
التغير المناخي» LS‏ نرى في الجدول ذي الاتجاهين أدناه مع نسب مئوية e‏ 
على متغير الصف بالجدول وهو warmop?‏ نسبة الإجابات الدقيقة الخاصة 
بالمتغير warmice‏ كانت %83 وهم الذين يعتقدون أن الإنسان يتسبب في 
تغييرات في المناخء ولكن %56 فقط Y‏ يعتقدون ذلك» أما الإجابة المخالفة 
للواقع؛ وهي أن الجليد في آخر فصل صيف بالمنطقة القطبية الشمالية غطى 
نفس المناطق التي كان يغطيها منذ 30 سنة مضت. هذه الإجابة كانت أربع 
مرات أكثر شيوعا بين الذين لا يعتقدون أن الإنسان يتسبب في تغييرات في 
المناخ» هذه الاختلافات ذات معنوية إحصائية عند (0.0000 = «(p‏ 
.8S8vy: tab warmop2 warmice, row percent‏ 


(running tabulate on estimation sample) 


Number of strata z 1 Number of obs = 516 
Number of PSUs = $16 Population size = 515.57392 
Design df = 515 











Believe 





happening 
now/human 


Arctic ice vs. 30 years ago 
Recovere More DK/NA 








Key: row percentages 


Pearson: 
Uncorrected chi2(3) = 55.2306 
Design-based F(3.00, 1544.45)= 14.6772 *P = 0.0000 
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الفصل )4( QA‏ الأمر catplot‏ الذي يساعد في إنشاء رسومات بيانية 
للمتغيرات «Axe gill‏ الأمر catp'ot‏ لا يتم تثبيته افتراضيا مع برنامج ستاتا» ولكن 
يجب تحديده وتحميله عن طرين طباعة الأمر «findit catplot‏ باستخدام الأمر 
ام يمكننا إنشاء أعمدة duly‏ تتعلق بالجدول الثنائى wel‏ عند اعتبار 
المتغيرالموزون الاحتمالي censuswt‏ كأو زان تحليلية ([aw-censuswt])‏ فإن النتائج 
في الأعمدة البيانية سوف تتشابه مع النسب الناتجة من الأمر .svy: tab‏ 

.catplot hbar warmice [aw=censuswt], 

over (warmop2) percent (warmop2) 

blabel (bar, format (%2.0£))  ytitle("Weighted 

percent") 


title("Arctic sea ice by humans changing 
climate’) 


Arctic sea ice by humans changing climate 


Less 
5 Recovered 
= No 
o More 
D: 
2 DK/NA 
o 
M 
g 
8 Less 83 
$ Recovered 
E Yes 





0 20 80 


, 40 60 
Weighted percent 


الشكل )8.9( 


الشكل )8.9( يشبه جدول النسب» واختبار oF‏ حيث يعرض العلاقة بين 
الاعتقادات والحقائق حول المناخ. يمكنك فحص ما إذا كانت هناك أنماط 
متشابهة ظهرت مع cyl gual‏ الرئيسين في استطلاع الرأيء المتغير warmco2‏ 
(الاتجاهات في (CO,‏ والمتغير warmgre‏ (تأثير الصوبات الزجاجية)؛ التفسير 
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التقليدي لمثل هذه الأنماط هو أن المعرفة توفر معلومات لمن لديهم اعتقادات 
حول المناخ» وفي هذه الحالة معرفة حقائق محددة حول المناخ توضح ما إذا 
GIS‏ النامن نون :أن الإنسان يتسبب في تغير. المناخ. وعنيوها c‏ تخت 
العلوم الاجتماعية التي تم إجراؤها حديثا وجدت دليلاً على علاقة سببية في 
I CELINE ES‏ ةةة أو خا BE as‏ 
تتناسب مع اعتقاداتهم عموماً. i‏ 


وللاستمرار مع هذه الفرضيات (اصطلاح "الاستيعاب المتحيّز") يمكننا 
تنل ارد ذو على لمن ta o nes wormiée:‏ تاا او )3:52 
المحتملة تتضمن العمر والجنس والتعليم ووجهة النظر السياسية. وعادة فإن 
هذه المتغيرات التنبؤية ترتبط مع وجهات النظر المتعلقة بالبيئة. في بيانات 
الدراسة الاستقصائية الموجودة لدينا متغير العمر age‏ يحتوي على سنواتء 
ومتغير الجنس sex‏ يحتوي على الرقم 0 للذكور والرقم 1 OL‏ ومتغير 
التعليم educ‏ يتراوح ما بين الرقم 1 للتعليم الثانوي أو أقل» لى الرقم 4 
للدراسات العلياء أما متغير الانتماء السياسي party‏ يتضمن الرقم 1 
للديمقراطيين والرقم 2 للمستقلين والرقم 3 للجمهوريين. 


.describe age sex educ party warmop2 warmice 


storage display value 
variable name type format label variable label 
age byte $9.0g age Age of respondent 
sex byte $9.0g sex2 Gender 
educ byte $14.0g educ Highest degree completed 
party byte $11.0g party Political party identification 
warmop2 byte $9.0g yesno Believe happening now/human 
warmice byte $9.0g warmice2 Arctic ice vs. 30 years ago 


كيف تؤثر هذه العوامل على ردود المشاركين حول الأسئلة المتعلقة 
بالمتغير Swarmice‏ هل الاعتقادات السائدة حول التغير المناخي يمكنها أن 
تساهم في توقع الإجابات إذا ما قمنا بالتحكم في التعليم والانتماء السياسي؟ 
نتائج الأمر olif mlogit‏ تعطي بعض الإجابات عن هذه الأسئلة. 


-Svy:  mlogit  warmice age sex educ party 
warmop2, rrr base(1) 
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(running mlogit on estimation sample) 


Survey: Multinomial logistic regression 


Number of strata 


Number of PSUS 


warmice 


Less 


Recovered 
age 
sex 

educ 
party 
warmop2 
_cons 


More 
age 
sex 
educ 
party 
warmop2 
_cons 


DK_NA 
age 
sex 
educ 
party 
warmop2 
_cons 


RRR 


486 


Linearized 
Std. Err. 


(base outcome) 


1.001732 
- 6975992 
- 8860304 
1.718036 

- 239992 
- 1196324 


1.023417 
. 5854667 
- 5378248 
1.169189 
1.270082 
. 0833092 


- 9866127 
1.253388 
- 8338215 
1.707791 
- 2443751 
- 2678258 


.0110398 
.2518093 
.1491035 
.4143614 
.1098955 
.1170444 


.014' 491 
.2578116 
.0936788 
.3220132 
.6225808 
. 0846524 


.0109802 
-4430697 
.1369808 
. 3624779 
.1004212 
- 2778029 


.16 
.00 
.72 
.24 
.12 
.17 


.61 
.22 
.56 
.57 
.49 
.45 


.21 
.64 
.11 
.52 
.43 
.27 


oo OOOO 


Number of 


obs 


Population size 


Design df 
F( 15, 
Prob > F 


P»|t| 


.875 
319 
.472 
.025 
.002 
.030 


ecoo00000 


.109 
.225 
.000 
571 
.626 
.015 


.226 
.523 
.269 
.012 
.001- 
.205 


ooooooc 


471) 


[95$ Conf. 


.9802738 
.3432281 
.6365725 
1.069604 

.097599 
.0174976 


.9948431 
.2464541 
.3819503 
.6805561 
.4847726 
.0113137 


-9652123 

.625799 
.6037919 
1.125423 
.1089927 
.0348926 


486 
485.77734 
485 

4.54 
0.0000 


Interval] 


1.023661 
1.417846 
1.233245 
2.759569 

.590131 
.8179363 


1.052811 
1.390812 
.7573119 
2.008656 
3.327558 
.6134542 


1.008425 

2.51036 
1.151487 
2.591516 
.5479193 
2.055758 


هذا المثال يستخدم أوزان بيانات الدراسة الاستقصائية. تركيبة الأمر 
أعلاه يمكن أن تتشابه (ولكن بدون استخدام svy‏ قبل الأمر) إذا لم نستخدم 
بيانات دراسة استقصائيةء الخيار base(l)‏ يحدد Aul‏ 1 (مناطق أقل" - 
(warmice‏ التي va si‏ أن تُكون نتيجة أساسية للمقارنة» وبذلك فإن الجدول 
المعروض BE‏ يتعرض المتغيرات التنبؤية لثلاث إجابات خاطئة مختلفةء Ld‏ 
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الخیار rrr‏ يطلب من الأمر C mlogit‏ يعرض نسب المخاطرة النسبية» والتى 
تشبه نسب الاحتمال التي يمكن الحصول عليها بالأمر .logistic‏ 

y petals ر الخاصدة‎ da pall Axial jbl al aud قان‎ cale Abas: y 
(مقارنة مع‎ y = j تساوي نسبة الاحتمال المتوقعة لصالح‎ x, والمتغير التنبؤي‎ 
المضروبة في 01 وحدة نقص واحدة في »× مع‎ (y = "النتيجة الأساسية"‎ 
عبارة‎ rrr ثبات العوامل الأخرى. بعبارة أخرىء فإن نسبة المخاطرة النسبية‎ 
تظل بنفس قيمتها.‎ x, عن المضروب في حالة أن جميع متغيرات × عدا‎ 


SPo-jlxu) _ للخبعازحنوم‎ 
P(y 7 base | x,) P(y = base | x,+1) 


نسب المخاطرة النسبية في المثال أعلاه تشرح التأثير المضاعف 5l‏ $35 
وحدة واحدة في كل متغير تنبؤي على احتمال اختيار إجابة معينة خاصة 
بالمتغير Yay warmice‏ من فئة أساسية (إجابة صحيحة) وهي الإجابة 'مناطق 
أقل". 

Lil‏ نرى أن الجمهوريين لهم تأثير ذو معنوية إحصائية )0.025 = (p‏ أكثر 
احتمالاً ليعتقدوا gb‏ الجليد عاد من جديدء بينما الذين يعتقدون أن أسباباً 
بشرية وراء التغير المناخي هم أيضا لهم تأثير ذو معنوية إحصائية 
(p = 0.002)‏ أقل احتمالاً ليعتقدوا ما يعتقده الجمهوريون. وفي حال SLE‏ 
العوامل الأخرىء فإن احتمالات أن أحد الجمهوريين ستكون إجابته أن الجليد 
عاد إلى مستوياته السابقة Yau)‏ من تغطية مناطق أقل) هي %72 أعلى 
(مضروبة في 1.72( بالمقارنة مع المستقلين» وأعلى بنسبة 76196 
(مضروبة في 2.96-1.722) من الديمقراطيين» أما الذين يعتقدون أن التغير 
المناخي يحدث EN‏ نتيجة الإنسان هم 6 أقل احتمالاً (مضروبة في 
us (0.24‏ إجابتهم أن الجليد عاد إلى مستوياته السابقة Yo‏ من انخفاضه. 


TIT, X 


الجزءان الثاني والثالث من الجدول يعرضان مخرجات الأمر mlogit‏ 
التي توضح نسب المخاطرة النسبية لصالح كل من الردود الأخرى للمتغير 
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"m 


القطب الشمالي يغطي مناطق ASÍ‏ من تلك التي كان يغطيها خلال 30 سنة 
ماضية هي Ada]‏ مفضتلة من قبل المشاركين الأقل تعليماء واحتمالات 
الحصول على هذه الإجابة انخفض بنسبة 9646 (مضروبة في 0.54) مع كل 
زيادة بمقدار وحدة واحدة في متغير educ‏ مع OLE‏ العوامل الأخرى. وعليهء 
(là‏ هذه الإجابة "عودة الجليد ليغطي مناطق أكثر" لها متغيرات تنبؤية تتعلق 
بالمعتقدات أو Lay‏ السياسيء Lay‏ الإجابة gh‏ "الجليد يغطي مناطق أكثر 
من ذي قبل" تبدو أنها تعكس عدم المعرفة لدى المشارك في الدراسة:؛ أما 
إجابة "لا أعرف" أو "عدم الحصول على إجابة" (DK/NA)‏ لها علاقة 
بمتغيرات تنبؤية تتعلق بالمعتقدات أو الانتماء السياسي» وربما تشير إلى نوع 
من الرفض للسؤال. 

الأمر margins‏ والأمر marginsplot‏ يمكنهما تمثيل النتائج بيانياء 
الأوامر أدناه تقوم بإنشاء رسم بياني تقريبي (الشكل 9.9( يعرض الاحتمالات 
المتوقعة ou‏ تكون الإجابة عن المتغير warmice‏ هي “less area” "Jal abi."‏ 
كدالة للاعتقادات عن المناخ Qwarmop2)‏ والانتماء السياسي بناءً على النموذج 
السابق «mlogit OU‏ وعند إضافة الخيار predict(outcome(1))‏ للأمر 
margins‏ يجعلنا نركز على نتيجة المتغير التابع 'مناطق “less area” "Jil‏ 


-margins, at(party = (1 2 3) warmop2 = (1 0)) 
vsquish predict (outcome ( 1)) 


بالمقارنة مع من 'يغطي مناطق dil‏ الإجابة التي DS‏ بأن جليد 














, Delta-method 

Margin Std. Err. 2 |12<م‎ [95% Conf. Interval] 

_at | 
1 - 8607879 - 0250921 34.31 0.000 - 8116084 .9099675 
2 .7289992 .0544082 13.40 0.000 .622361 .8356373 
3 .8143384 .0286563 28.42 0.000 .7581732 .8705037 
4 .626633 -0416184 15.06 0.000 . 5450624 . 7082036 
5 - 7500431 - 0495879 15.13 0.000 6528526 -8472336 
6 . 5072642 .0445321 11.39 0.000 .419983 .5945455 
MESI DIL EIE LL a REA ا‎ RL ae 


an 
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Predictive margins Number of obs 
Model VCE : Linearized 
Expression : Pr(warmice==Less), predict(outcome(1)) 
l._at : party = 1 
warmop2 = 1 
2._at : party zi 1 
warmop2 = 0 
3. at : party = 2 
warmop2 = 1 
4. at : party = 2 
warmop2 = 0 
5. at : party 3 3 3 
warmop2 = 1 
6._at : party = 3 
warmop2 = 0 


. marginsplot 


Predictive Margins with level(95)% Cls 


6 7 8 


Pr(Warmicez-Less) 


5 





Democrat Independent Republican 
Political party identification 


الشكل )9.9( 
ولإنشاء رسم بياني للاحتمال المتوقع للحصول على الإجابة الثانية 
للمتغير warmice‏ تكون "عودة الجليد" "recovered"‏ نقوم 2—SÀ‏ ار الأمر 
margins‏ ولكن مع cpredict(outeome(2)) JLA‏ الشكل )10.9( يعرض 
النتائج. 


.margins, at(party = (1 2 3) warmop2 = (1 0)) 
vsquish predict (outcome (2)) 
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RR RR eR‏ كاك الل د سس دن ور رودي Roc‏ 


Predictive margins Number of obs = 486 
Model VCE : Linearized 
Expression : Pr(warmice==Recovered), predict (outcome (2)) 
1. at : party z 1 
warmop2 z 1 
2. at : party = 1 
warmop2 = 0 
3. at : party = 2 
warmop2 = 1 
4. at : party = 2 
warmop2 = 0 
5. at : party z 3 
warmop2 z I 
6. at : party = 3 
warmop2 = 0 










Delta-method 
Margin Std. Err. z P>|z| (95% Conf. Interval] 











1 . 0290269 - 0112526 2. 0. .0069723 .0510815 
2 .1023611 .0404401 2.53 0.011 .0231001 .1816222 
3 .0470891 .0156777 3.00 0.003 .0163614 .0778168 
4 .1507864 .0329816 4.57 0.000 -0861437 . 2154292 
5 .0743527 .0306377 2.43 0.015 .014304 .1344015 
6 .2091542 .0372832 5. 0. .1360805 .282228 





-marginsplot 
Predictive Margins with level(95)96 5 
e 
g 
à 2 
2 
3 
E YS 
Š 
a 
Democrat Independent Republican 


Political party identification 


الشكل )10.9( 
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الشكل )11.9( هو عبارة عن نسخة مطوّرة من الشكل )9.9( وهو 
يوضح استخدام بعض خيارات الأمر «marginsplot‏ ونبدأ بالخيار quietly‏ 
ونكرر استخدام الأمر margins‏ للإجابة 1 (مناطق أقل) ثم نقوم بطباعة 
الأمر marginsplot‏ مع خيارات أخرى للتحكم في تفاصيل التوصيفات بالرسم 
ومربع الشرح والخطوطء تم توسيع قياسات المحور الأفقي من 1 إلى 3.1 
بدلا من الوضع الافتراضي وهو من 1 إلى 3 وذلك حتى نستطيع وضع 
التوصيف "جمهوري" "Republican"‏ داخل الرسم البياني بالأسفل Age‏ اليمين. 


.quietly margins, at(party = (1 2 3) warmop2 = 
(1 0)) predict (outcome (1) ) 

.marginsplot, .1egend (position (7) ring (0) 
rows(1) 

title("Believe humans" "changing climate?", 
size (medsmall1) ) ) 

xscale(range(1 3.1)) ytitle("Probability") 


plotiopts (lpattern (dash) lwidth (medthick) 
msymbol (O) ) 

plot2opts (lpattern(solid) lwidth(medthick) 
msymbol (Sh) ) N 


title("Predicted probability of  'Artic ice 
area less’ 
response") 


Predicted probability of ‘Artic ice area less’ response 


Probability 


Believe humans 
changing climate? 
—-*—-- No ——B—- Yes 





Democrat __ Independent Republican 
Political party identification 


الشكل )11.9( 
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الإسناد اطتعدد للقيم اطفقوده — مثال الاتحدار اللوغاريتمي : 


Multiple Imputation of Missing Values — Logit Regression Example 


الفصل )8( عرض طرق الإسناد المتعدد للقيم المفقودة» مستخدما مثالا 
عن الانحدارء طرق الإسناد المتعدد تعمل مع الأنواع الأخرى من الانحدار 
بما فيها الانحدار اللوغاريتمي الذي تم شرحه في هذا الفصلء ولتوضيح ذلك 
سوف نعود لاستخدام بيانات استطلاع جرانيت» ومؤشر الاعتقاد بوجود 
التغير المناخي 2 الجزء السابق اختبر العمر والجنس ومستوى 
التعليم والانتماء السياسي كمتغيرات تنبؤية محتملة للإجابة عن سؤال المعرفة 
بالمناخ warmice‏ هذه الخصائص الأربع عادة يُعتقد بأن لها علاقة في 
البحوث المتعلقة بالتأثيرات الاجتماعية للمشاكل البيئيةء لذلك فمن المعقول 
ou Asse yl‏ أحدها أو أكثر سوف تكون لها علاقة بالمتغير «warmop2‏ وهل 
يُفترض أن نأخذ في الاعتبار دخل رب الأسرة والخصائص المهمة الأخرى 
كمتغير تنبؤي محتمل؟ إحدى المشاكل المتعلقة بدخل رب الأسرة في 
استطلاع جرانيت هي أنها تحتوي على عدد كبير من القيم المفقودة؛ OY‏ 
الكثير من المشاركين لا يميلون للإجابة عن هذا السؤال. 

عشر متغيرات من ملف البيانات Granite2011. 06.dtà‏ سوف يتم 
استخدامها في هذا التحليل» أ بعة متها (employ, ownrent, married, yrslive)‏ 
نظرياً ليست لها أهمية عند الحديث عن الاعتقاد بوجود التغير المناخيء 
ولكنها ربما تساعد في إسناد القيم الحفقودة لمتغير دخل رب الأسرة income‏ 


suse C:\data\Granite2011_6.dta, clear 


-describe warmop2 age sex educ party income 
employ ownrent married yrslive 
storage display value 
variable name type format label variable label 


ees 


warmop2 byte %9.0g yesno Believe happening now/human 





age byte %9.0g age Age of respondent 

sex byte $9.0g 5 2 Gender 

educ byte *14.0g educ Highest degree completed 

party byte 8511.09 party Political party identification 
income byte &9.0g income3 Hdusehold income 2009 

employ byte $13.0g employ Employment status 

ownrent byte $13.0g ownrent Own or rent home 

Married byte $9.0g yesno Respcndent married 


yrslive byte 58 . و0‎ yrslive Years lived in NH 
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.misstable summarize warmop2 age sex educ party 
income employ ownrent married yrslive 


Obs«. 












Unique 


Variable values Min Max 














age 
educ 4 1 4 
party 3 1 3 
income 7 1 7 
employ 8 1 8 
ownrent 2 0 1 
yrslive 4 1 4 





بالرغم عن Lil‏ قمنا بإدراج المتغير warmop2, sex, married «i‏ ضمن 
الأمر misstable‏ فإن ستاتا كشف أن هذه المتغيرات لا تحتوي على قيم 
مفقودة» ولم يتم عرضها ضمن المخرجات. ومن ناحية أخرىء فإنه لدينا 
1 قيمة مفقودة من أصل 516 قيمة بمتغير income‏ وإذا قمنا بحساب 
انحدار المتغير الثنائي warmop2‏ على المتغير income‏ مع المتغيرات التي 
يمكن أن يكون لها علاقةء فإن التقديرات تتضمن 340 مشاهدة فقط. 

.Svy: logit warmop2 age sex educ party income 


(running logit on estimation sample) 


Survey: Logistic regression 


Number of strata = 1 Number of obs = 340 
Number of PSUs = 340 Population size = 336.84437 
Design df = 339 
F( 5; 335) = 13.47 
Prob > F = 0.0000 
















Linearized 
Coef. Std. Err. t P»|t| [95$ Conf. Interval] 





warmop2 





age -.014292 .0092398 71.55 0.123 -.0324666 .0038826 
sex 4762698 . 5 1.68 0.093 -.0802685 1.032808 
educ - 2508435 .1525283 1.64 0.101 -.0491775 .5508646 
party -1.176907 .1547857 -7.60 0.000 -1.481369 -.8724461 
income .0366035 .0768294 0.48 0.634 -.114519 .1877259 
_cons 2.252896 7778417 2.90 0.004 .7228924 3.7829 





446 الإحصاء مع برنامج ستاتا 








المتغير الوحيد الذي له تأثير ذو المعنوية الإحصائية هو الانتماء 
السياسي. هل سوف نحصل على نفس النتيجة إذا ما قمنا بإجراء هذا التحليل 
من جديد بدون استبعاد أي بيانات جانبا؟ الإسناد المتعدد يُعتبر وسيلة للإجابة 
على هذا السؤال. 


نقوم بأول خطوة في عملية الإسناد وهي استبعاد 42 مشاهدة لها قيم 
مفقودة في أي من المتغيرات ذات العلاقة باستثناء متغير income‏ وبعد القيام 
بذلك» سوف تكون لدينا بيانات تحتوي على 516 - 42 = 474 مشاهدة 
تتضمن 137 مشاهدة هي عبارة عن قيم مفقودة خاصة بالمتغير „income‏ 


.keep if !missing(warmop2, age, sex, educ, 
party, employ,ownrent, married, yrslive) 
(420bservations deleted) 

.misstable summarize warmop2 age sex educ party 
income employ ownrent married yrslive 


Obs«. 







Unique 
values 







Variable 









income 


في الخطوة التالية» سوف نقوم بتحديد تنسيق لبيانات الإسناد المتعدد 
باستخدام الخيارعه1 وهو اختيار لكفاءة الذاكرة. المتغير income‏ سوف يتم 
تسجيله باستخدام الخيار imputed‏ وهذا يعني Ud‏ سوف نحاول أن نقوم 
بتعويض القيم المفقودة للمتغير cincome‏ أما المتغيرات الأخرى فسوف يتم 
تسجيلها كمتغيرات عادية regular‏ ولن يتم إسنادها. 


-mi set mlong 
.mi register imputed income 


(137m=0 obs. now marked as incomplete) 


emi register regular warmop2 sex educ party 
employ ownrent married yrslive 


137 مشاهدة قيمها مفقودة بالمتغير income‏ والتي تم توقعها باس تخدام 
الانحدار مع المتغير ات cemploy, ownrent, married, yrslive‏ تم إنشاء 50 قيمة 
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إسناد لكل القيم المتوقعة 137 زائداً تذبذبا cud pae‏ عمليات الإسناد هذه تم 
تجميعها لتقدير نموذج انحدار لوغاريتمي جديد. 


.mi impute regress incomeemploy ownrent married 
yrslive, add(50) rseed(12345) 


Univariate imputation Imputations - 50 
Linear regression added - 50 
Imputed: 7-1 through 750 updated = 0 






Observations per 7 













Variable Complete Incomplete Imputed 





income 337 


(complete + incomplete - total; imputed is the minimum across 7 
of the number of filled-in observations.) 


.mi estimate: svy: logit warmop2 age sex educ 
party income 


Multiple-imputation estimates Imputations z 50 


Survey: Logistic regression Number of- obs = 474 

Number of strata = 1 Population size = 472.04182 
Number of PSUs = 474 

Average RVI = 0.0298 

Largest FMI = 0.1511 

Complete DF = 473 

DF adjustment: Small sample DF: min = 338.55 

avg = 443.42 

max = 470.18 

Model F test: Equal FMI F( 5, 469.8) = 16.88 

Within VCE type: Linearized Prob > F = 0.0000 











(95% Conf. Interval] 










age -.0188856 .0075324 -2.51 0.013 -.033687 -.0040842 
sex - 4338802 - 2372722 1.83 0.068 -.0323649 -9001254 
educ - 2489546 .1262441 1.97 0.049 .0008665 .4970427 
party -1.154414 .1318129 -8.76 0.000 -1.41343 -.8953988 
income -0134369 .0681875 0.20 0.844 -.1206877 .1475614 
-cons 2.669003 .6581604 4.06 0.000 1.375593 3.962413 
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بعد إجراء عمليات الإسناد المتعددء فإن مُعَامل المتغير party‏ يظل قريبا 
من سابقه (1.15- بالمقارنة مع السابق وهو 1.18-) ولايزال تأثيره ذا 
معنوية إحصائية. النتائج الأخرى تظهر تغيرا OS)‏ وهذا التغير يتضمن 
تغيرا في المُعاملات ولكن بصفة عامة تتشابه مع الأخطاء المعيارية مما 
يعكس أن التقديرات أصبحت ASÍ‏ دقة بعد el ja]‏ عمليات الإسناد للبيانات» 
من خلال هذه التعديلات فإن مُعاملات المتغير age‏ (سالب) والمتغير educ‏ 
(موجب) الآن أصبحت ذات معنوية إحصائيةء وهذا يشبه النتائج التي 
أظهرتها دراسات سابقة حول الاعتقاد بوجود التغير المناخي. ومن ناحية 
«s yal‏ فإن المتغير income‏ يبدو أقل It‏ قبل وبغد إجراء عملية الإسناد. 
هذه النتيجة تدعم وجهة النظر التي تقترح استبعاد متغير income‏ من النموذج 
النهائي» والتركيز على المتغيرات التنبؤية الأكثر أهمية والأقل إشكالا. 


wheal) 
sila نماذج عد الأحداث‎ 


Survival and Event-Count Models 





يعرض هذا الفصل» نماذج لتحليل بيانات الحدث وتحليل البقاء. تحليل 
البقاء يتضمن عدة تقنيات ONS‏ صلة تركز على أزمنة وقوع الحدثء وبالرغم 
من أن الحدث يمكن أن يكون حسنا أو سيئاء فإننا سوف نتفق على أن نشير 
إلى أن الحدث باسم "الفشل". والوقت اللازم للفشل يسمى 'زمن البقاء". تحليل 
البقاء مهم جدا في البحوث الطبية الحيويةء ولكن يمكن تطبيقه بشكل متساو 
على الحقول العلمية الأخرى من الهندسة إلى العلوم الاجتماعية. فمثلا عند 
صياغة نموذج للزمن اللازم للشخص العاطل عن العمل للحصول على 
وظيفةء أو الشخص العازب حتى يتزوج» فإن برنامج ستاتا يوفر عدذا Das‏ 
من طرق تحليل البقاء. وهذا الفصل سوف يشرح le ja‏ بسيطا منها. 

وسوف نلقي نظرة سريعة على انحدار بواسون ومكوناته. هذه الطرق 
لا تركز فقط على أزمنة البقاء» ولكن تركز Laf‏ على معدلات أو أعداد 
الأحداث خلال فاصل زمني محدد. طرق عد الأحداث تتضمن انجدار 
بواسون» والانحدار الثنائي السالب. مثل هذه النماذج يمكن صياغتها باستخدام 
أوامر محددة أو باستخدام المدخل الأكثر شمولاء وهو النموذج الخطي العام 
generalized linear modeling (GLM)‏ 

يرجى الاطلاع على دليل المستخدم Survival Analysis and Epidemiological‏ 
Tables Reference Manual‏ للحصول على مزيد من المعلومات عن إمكانات 
برنامج ستاتا. أو قم بطباعة الأمر help st‏ للاطلاع على نظرة عامة على 
شبكة الإنترنت عن هذا التحليل. كما أن دراسة Selvin‏ (2004) تقوم بتوضيح 
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تحليل البقاء وانحدار بواسون. وقد قام مؤلف هذا الكتاب باستعارة (بعد 
الحصول على إذن بذلك) بعض الأمثلة من دراسة Selvin‏ الشرح المفيد الآخر 
عن تحليل البقاء oo Sa‏ الحصول عليه من GLAS‏ خاص عن برنامج ستاتا 
تم إعداده من قبل Vleves et al.‏ )2010( وهناك فصل تم إعداده من قبل 
Rosner‏ )1995(« كما تم alae]‏ شرح متكامل من قبل Hosmer, Lemeshow and‏ 
Lee y (2008) May‏ (1992)» وتم شرح النماذج الخطية العامة من قبل 
McCullagh and Nelder‏ )1989(« وفي كتاب Long‏ )1997( هناك فصل حول 
نماذج الانحدار ad‏ البيانات (يشمل بواسون وذا الحدين السالب) وأيضاً بعض 
الأمثلة عن النماذج الخطية العامة. ويمكن الحصول على شرح dau‏ عن 
النماذج الخطية العامة في كتاب Hardin and Hilbe‏ (2012). 
مجموعات قوائم ستاتا التي لها علاقة بهذا الفصل تتضمن: 
Statistics < Survival analysis‏ 
Graphics > Survival analysis graphs‏ 
Statistics > Count outcomes‏ 
Statistics > Generalized linear models‏ 
وتجدر الإشارة gl‏ الجداول الوبائية لم يتم تناولها في هذا الفصلء 
وللحصول على معلومات عنها قم بطباعة الأمر help epitab‏ أو قم بالاطلاع 
على قوائم ستاتا: 
Statistics < Epidemiology and related‏ 
álipl‏ عن الأوأمر : Example Commands‏ 
أغلب أوامر تحليل البقاء ببرنامج ستاتا (ste)‏ تتطلب أن تكون البيانات قد 
58 تحديدها مسبقاً كزمن elis‏ باستخدام الأمر estset‏ ويجب اس تخدام الأمر 
stset‏ مرة واحدة» وبعد ذلك سوف يتم حفظ البيانات. 
-Stset timevar, failure(failvar)‏ 
يقوم بتحديد سجل مفرد Sra}‏ بيانات زمن بقاء المتغير ENF‏ يشير 
إلى الزمن الذي مضى قبل وقوع حدث معين (يسمى "الفشل') أو الفترة التي 
انتهت فيها المشاهدة ("المراقبة"). Ul‏ المتغير failvar‏ يشير إلى ما إذا كان 
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الفشل )1 = (failvar‏ أو المراقبة )0 = (failvar‏ عند الزمن .rmevar‏ البيانات 
تحتوي فقط عل سجل واحد لكل حدث» ويجب تحديدها باستخدام الأمر stset‏ 
قبل استخدام أوامر *؛5 في أي حسابات. وإذا قمنا بحفظ البيانات» فإن 
تحديدات الأمر stset‏ سوف يتم حفظها أيضا. الأمر stset‏ يقوم بإنشاء 
متغيرات جديدة اسمها 10_ st d, f‏ وهي عبارة عن jae fi‏ للمعلومات 
اللازمة لاستخدام أي أمر من أوامر *)و. 7 

.Stset  timevar, failure(failvar)  id(patient) 

enter(time start) 


يقوم بتحديد بيانات أزمنة البقاء لسجلات متعددة؛ وفي هذا المثال» فإن 
المتغير timevar‏ يشير إلى الوقت الذي مضى قبل حدوث الفشل أو المراقبة. 
المتغير failvar‏ يشير إلى ما إذا كان الفشل (1) أو المراقبة )0( حدثت عند 
هذا الوقت. المتغير patient‏ عبارة عن رقم محدد. نفس الحالة يمكن أن 
تساهم في أكثر من سجل واحد في البيانات» ولكنها دائماً لها نفس الرقم 
المحدد. المتغير start‏ يقوم بتسجيل زمن مراقبة كل مشاهدة. 
.Stdescribe‏ 
يشرح بيانات زمن البقاء» ويضع قائمة بالتعريفات والخصائص الأخرى 
للبيانات التي قام بإنشائها الأمر stset‏ 
-stsum‏ 
يقوم بإنشاء إحصائيات مختصرة تتضمن: الوقت (KI‏ عند الخطظرء 
معدل الوقوع» عدد المجموعات» ونسب أزمنة البقاء. 
.Ctset time nfail ncensor nenter, by(ethnic sex)‏ 
يحدد بيانات أزمنة العد. وفي هذا المثالء فإن المتغير time‏ عبارة عن 
مقياس للوقت. والمتغير nfail‏ يمثل axe‏ مرات الفشل التي حدثت عند الزمن 
crime‏ ويمكننا إضافة متغيرات أخرى مثل المتغير aae) mcensor‏ المشاهدات 
التي تمت مراقبتها عند الزمن (time‏ والمتغير aie) renter‏ المدخلات عند 
الزمن (time‏ وتجدر الإشارة إلى أن إضافة هذه المتغيرات إاختياريةء كما أن 
المتغير ethnic:‏ والمتغير sex.‏ هما متغيران تسصنيفيان آخران يُعرقان 
المشاهدات في هذه البيانات. 
.cttost‏ 
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a gly‏ بتحويل بيانات أزمنة العد - والتي تم تحديدها مسبقاً باس تخدام 
الأمر etset‏ - بحيث تكون في شكل أزمنة بقاء يمكن تحليلها باس تخدام 
مجموعة أوامر *)و. 
.8t8 graph‏ 
يقوم بإنشاء رسم بياني لدالة بقاء كابلان ميير «Kaplan-Meier‏ ولمقارنة 
اثنتين أو أكثر من دوال البقاء - مثل مقارنة قيمة واحدة في كل متغير تصنيفي 
sex‏ - نقوم باستخدام الخيار ebyQ‏ وتكون تركيبة الأمر على شكل sts graph,‏ 
by(sex)‏ وللتعديل باستخدام انحدار كوكس على تأثيرات متغير مستقل مستمر مثل 
متغير العمر cage‏ نقوم باستخدام الخيار «adjustfor()‏ وتكون تركيبة الأمر 
على شكل .sts graph, by (sex) adjustfor(age)‏ فالخيارات adjustfor() ; by()‏ 
تعمل بنفس الطريقة مع الأمر sts list‏ والأمر sts generate‏ 
-8ts list‏ 
يقوم بإنشاء قائمة تحتوي على Alla‏ بقاء كابلان ميير المقذرة. 
.8ts test sex‏ 
يقوم باختبار التساوي بين دوال بقاء كابلان ميير في فئات المتغير Sex‏ 
.8ts generate survfunc = S‏ 
يقوم بإنشاء متغير جديد تتم تسميته عشوائياً باسم suryfunc‏ يحتوي على 
Alla‏ بقاء كابلان ميير المقذرة. 
x1 x2 x3 1‏ عدم 86 . 
يقوم هذا الأمر بصياغة نموذج المخاطرة النسبي لكوكس» وانحدار 
الزمن إلى الفشل على المتغيرات التنبؤية الوهمية أو المستمرة X3, x2, x1‏ 


-Stcox x1 x2 x3, strata(x4) vce(robust) 
predict hazard, basechazard 


يقوم هذا الأمر بصياغة نموذج المخاطرة النسبي لكوكس مقسمة إلى 
Glib‏ باستخدام المتغير .x4‏ الخيار ca ls vee(robust)‏ تقدير Chil‏ 
المعياري الموثوق» انظر Jail‏ )8( أو دليل المستخدم User's Guide‏ 
للحصول على شيرح كامل للأخطاء المعيارية الموثوقة. الأمر predict‏ يقوم 
lis,‏ دالة المخاطرة التراكمية الأساسية لمجموعة محددة» ويتم حفظها 
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كمتغير جديد باسم hazard‏ للحصول على خيارات أكثر قم بطباعة help‏ 
-stcox postestimation‏ 
.Stphplot, by(sex)‏ 
يقوم بإنشاء رسم بياني ل In(-In(survival))‏ — مقابل In(analysis time)‏ 
لكل مستوى للمتغير النوعي sex‏ من نموذج steox‏ السابق» Lon‏ المنحنيات 
Seite TER‏ كين الك tiie Level as‏ و بون 
مع الوقت. ولإجراء فحوصات أخرى لفرضيات كوكس يمكن القيام بها 
باستخدام الأمر steoxkm‏ (يقارن منحنيات كوكس المتوقعة مع منحنيات البقاء 
المشاهدة لكابلان وميير) والأمر estat phtest‏ (يقوم بالاختبار بناء على بواقي 
شونفيلد .(Schoenfeld residuals‏ لمعرفة المزيد عن خيارات وتركيبة هذه 
الأو امر قم بطباعة -help stcox diagnostics‏ 
¿streg x1 x2, dist(weibull)‏ 
يقوم بصياغة نموذج توزيع ويبل Weibull-distribution‏ لانحدار نسبة 
الوقت إلى الفشل على متغير تنبؤي وهمي أو مستمر X2 4x1‏ 


.Streg x1 x2 x3 x4, dist (exponential) 
vce(robust) 


يقوم بصياغة نموذج التوزيع الأسي لانحدار الوقت إلى الفشل على 
متغيرات تنبؤية وهمية أو مستمرة 1× ex4, x3, x2,‏ كما يقوم بحساب تقديرات 
الخطأ المعياري لاختلاف التباين الموثوق cheteroskedasticity-robust‏ 
بالإضافة إلى توزيع ويبل» والتوزيع GLA‏ والتوزيعات الأخرى للأمر dist)‏ 
ومحددات الأمر Les streg‏ فيها اللوغاريتم الطبيعي واللوغاريتم المنطقي 
وتوزيعات جاما المعيارية وتوزيعات جومبرتز Gompertz‏ وللحصول على 
مزيد من التفاصيل عن هذا الأمر وخياراته قم بطباعة الأمر streg‏ ماعط. 
.Stcurve, survival‏ 
بعد استخدام الأمر estreg‏ فإن الأمر أعلاه يقوم بإنشاء رسم بياني لدالة 
البقاء لنتائج النموذج الذي تم حسابه بالأمر streg‏ للقيم Al. aa ial‏ لكل 
cines‏ 
-Stcurve, cumhaz at(x3=50, x4=0)‏ 
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بعد استخدام الأمر estreg‏ فإن الأمر أعلاه يقوم بإنشاء رسم بياني i Mal‏ 
المخاطرة التراكمية لنتائج النموذج الذي تم حسابه بالأمر streg‏ للقيم المتوسطة 
للمتغيرات x2x]‏ ,3× عند القيمة 50 Ul‏ المتغير 4× فيكون عند القيمة 0. 

.poisson count x1 x2 x3, irr exposure(x4) 

يقوم بحساب انحدار بواسون لمتغير الأحداث المعدودة count‏ (مفترضا 
أنها تتبع توزيع بواسون) على المتغيرات المستقلة الوهمية أو المستمرة 
x3, ×2, ×1‏ » وسوف يتم عرض تأثيرات المتغيرات المستقلة كنسب لمعدل 
الوقوع exposure) JLA LÍ (irr)‏ فهو يقوم بتحديد متغير يشير إلى كمية 
العرض في حالة عدم تساوي العرض لجميع المشاهدات؛ ويجب ملاحظة أن 
أي نموذج بواسون يفترض أن احتمالية الحدث تبقى ثابتة بغض النظر عن 
عدد مرات وقوع الحدث في كل مشاهدة. وإذا لم تبق الاحتمالية ثابتةء فإننا 
بدلا من ذلك يجب أن نأخذ في الاعتبار استخدام الأمر nbreg‏ (انحدار ذو 
حدين سالب) والأمر gnbreg‏ (انحدار ذو حدين سالب معياري). 

-glm count x1 x2 x3, link(log) family (poisson) 


exposure(x4) eform 
يقوم بحساب الانحدار بنفس الطريقة المشار إليها في المثال أعلاه‎ 
يمكن أن يتناسب‎ glm الأمر‎ (GLM) ولكن كنموذج خطي معياري‎ «poisson 
مع نموذج بواسون وذي الحدين السالب واللوغاريتمي والعديد من أنواع‎ 
(رابط الدالة)‎ linko النماذج الأخرى؛ وهذا يعتمد على ما هي الخيارات‎ 
(مجموعة التوزيع) التي تستخد‎ family( s 


Survival-Time Data : البقاء‎ dupl بيانات‎ 


بيانات أزمنة البقاء تتضمن متغيرًا واحدًا على الأقلء وهذا المتغير يقوم 
بقياس كم يمضي من Cá dl‏ قبل وقوع حدث معين في كل مشاهدة. . المراجع 
الإحصائية في sali‏ تقوم بتسمية هذا الحدث 'فشل" بغض النظر عن المعنى 
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الحقيقي لهذه الكلمة» عند عدم وقوع الفشل في مشاهدة ما في بيانات أزمنة 
البقاء بنهاية عملية جمع هذه البيانات» فإن المشاهدة يجب أن يقال عنها 
'مُراقبة". الأمر stset‏ يحدد البيانات التي سوف يتم استخدامها في تحليل 
أزمنة البقاء»ء وذلك من خلال تحديد المتغير الذي يقوم بقياس الزمن (وإذا 
كان ضروريا) تحديد المتغير الثنائي (1 ,0( كمؤشر لمعرفة ما إذا كانت 
المشاهدة "شل" i‏ 'مراقبة". البيانات يمكن أن تحتوي على أي رقم لمقياس 
آخر أو متغيرات نوعية»ء والأفراد (مثلا المرضى في المستشفيات) يمكن 
تمثيلهم بواسطة أكثر من مشاهدة. 
cox,‏ | ستخدام الأمر C$ gu stset‏ نبدأ بمثال من دراسة Selvin‏ 

)1995:453( التي تحتوي على بيانات 51 شخصاً تم تشخيصهم على e—‏ 
مصابون بمرض نقص المناعة HIV‏ البيانات توجد في الملف aids.raw‏ 
وتظهر البيانات كما يلي: 

1 1 1 34 

2 ag Woo 

3. 37 0 47 


(rows 4-50 omitted) 
51 81 0 29 


قيم العمود الأول (من الجهة اليسرى) تظهر عدد الحالات ol)‏ 2 3 
... 51). العمود الثاني يوضح كم شهرًا مضى بعد التشخيص وقبل أن تظهر 
على الشخص أعراض AIDS Gaye‏ أو نهاية الدراسة )1( 17ء 37 (ue‏ 
العمود الثالث يحتوي على 1 إذا كان الشخص ظهرت عليه أعراض مرض 
AIDS‏ (الفشل) أو 0 إذا لم تظهر الأعراض في فترة نهاية الدراسة (مراقبة)؛ 
العمود الأخير يوضح أعمار الأشخاص عند وقت, التشخيص. 

يمكننا قراءة البيانات الخام في الذاكرة باستخدام الأمر dnfile‏ ثم نقوم 
بوصف المتغيرات والبيانات: 


.infile case time aids age using 
C:\data\aids.raw, clear 
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.label variable case "Case ID number' 
.label variable time "Months since HIV diagnosis 
.label varia^le aids "Developed AIDS symptoms 
.label variable age "Age in years’ 

.label data "AIDS (Selvin 1995:453)' 

.Compress 


الخطوة التالية هي تحديد المتغير الذي يقوم بقياس الزمن» والذي يشير 
إلى الفشل أو المراقبة. وبالرغم من أنه ليس من الضروري مع هذا النوع من 
البيانات تحديد رقم مميز لكل حالةء فإننا سوف نقوم بذلك. الأمر stset‏ يحدد 
المتغير الذي يقوم بقياس الزمن» وبالتالي سوف نحدد الفشل failure)‏ كممثل 
وهمي يُحدد ما إذا كانت المشاهدة فشل )1( أو مراقبة (0)» وبعد اس تخدام 
الأمر stset‏ سوف نقوم بحفظ البيانات في ملف بتنسيق ستاتا للحفاظ على هذه 


البيانات. 
. 
-stset time, failure(aids) id(case)‏ 
id: case‏ 
failure event: aids != 0 © aids > .‏ 
obs. time interval: (time( n-1], time]‏ 
exit on or before: failure‏ 
total obs.‏ 51 
exclusions‏ 
obs. remaining, representing‏ 51 
subjects‏ 51 
failures in single failure-per-subject data‏ 25 
total analysis time at risk, at risk from t - 0‏ 3164 
earliest observed entry t - 0‏ 
last observed exit t - 97‏ 


-save aids.dta, replace 
يعرض توصيفا مختصرا لكيفية تركيب بيانات أزمنة البقاء.‎ Stdescribe 
لدينا في هذا المثال البسيط سجل واحد فقط لكل شخصء ولذلك فإن بعمض‎ 


هده المعلومات غير ضرورية. 
8tdescribe‏ . 
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failure d: aids 
analysis time t: time 





id: case 

m per subject — 
Category total mean min median max 
no. of subjects 51 
no. of records 51. 1 1 1 1 
(first) entry time 0 0 
(final) exit time 62.03922 1 67 97 
subjects with gap 0 
time on gap if gap 0 : 5 ; 
time at risk 3164 62.03922 1 67 97 
failures 25 .4901961 0 0 1 


الأمر agi stsum‏ بحساب إحصائيات مختصرة» حيث ينضح أنه لدينا 
5 فشلاً من 3,164 شخص/ شهرء وهذا يعني أن معدل الحدوث هو 25 + 
3164 = 0.0079014 » أما نسب زمن البقاء فسوف يتم اشتقاقها من دالة 
البقاء لكابلان-- ميير (الجزء التالي من هذا الفصل). الدالة تقوم بتقدير نحو 
5 فرصة للإصابة بمرض AIDS‏ خلال فترة 41 شهرا بعد التشخيصء» 
و9050 خلال فترة 81 شهراء خلال الفترة التي تغطيها البيانات (نحو 97 
(Deà‏ احتمالية الإصاية بمرض AIDS‏ لم تصل لنسبة 7675 ولذا ليست 
هناك نسبة ترتيبها 75. 
-stsum‏ 


failure _d: aids 
analysis time _t: time 
id: case 


incidence no. of حم‎ Survival time 
time at risk rate subjects 25% 50% 75% 





total 3164 0079014 51 41 81 


. إذا احتوت البيانات على متغير نوعي أو متغير تجميعي مثل الجنسء 
فإنه يمكننا الحصول على إحصائيات مختصرة لزمن البقاء بشكل منفصل 
لكل مجموعة بواسطة الأمر التالي: 


-Stsum, by(sex) 
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الجزء التالي يشرح طرقا أكثر منهجية للمقارنة بين أزمنة البقاء 
لمجموعتين أو أكثر. 


Count-Time Data : حساب الزمن‎ olly 





بيانات زمن البقاء (st)‏ بالملف aids.dta‏ تحتوي على معلومات عن 
حالات فردية (أشخاص أو أشياء) مع متغيرات تشير إلى زمن وقوع الفشل 
أو المراقبة لكل حالة فرديةء هناك نوع آخر مختلف من البيانات يسمى 
'حساب الزمن" تحتوي على بيانات إجمالية مع متغيرات تقوم بتعداد الحالات 
الفردية للفشل أو المراقبة عند الزمن ot‏ فعلى سبيل المثالء ملف البيانات 
diskdriv.dta‏ يحتوي على معلومات عن اختبار افتراضي ل 25 سا 
iia‏ كل الأقراص باستثناء 5 فقط فشلت قبل نهاية الاختبار عند زمن 


1,0 ساعة. 
.use C:\data\diskdriv.dta, clear‏ 
.describe‏ 
Contains data from C:\data\diskdriv.dta‏ 
obs: 6 Count-time data on disk drives‏ 
vars: 3 1 Jul 2012 18:13‏ 
size: 24‏ 
storage display value‏ 
variable name type format label variable label‏ 
hours int $8.0g Hours of continuous operation‏ 
failures byte $8.0g Number of failures observed‏ 
censored byte $9.0g Number still working‏ 
Sorted by:‏ 
.list‏ 
hours failures censored‏ 
Is‏ 
.2 
3 
.4 
.5 
m‏ 
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لتحديد بيانات على أنها بيانات حساب الزمن» يجب علينا تحديد متغير 
الوقت» ومتغير لعدد مرات الفشلء ومتغير لعدد مرات المراقبة على التوالي. 
فبعد استخدام الأمر ctest‏ يقوم الأمر cttost‏ تلقائياً بتحويل بيالنات حساب 

الزمن إلى تنسيق زمن البقاء. 
.ctset hours failures censored‏ 


dataset name: C:\data\diskdriv.dta 
time: hours 
no. fail: failures 
no. lost: censored 


no. enter: -- (meaning all enter at time 0) 
.cttost 

failure event: failures !- 0 © failures > 
obs. time interval: (0, hours] 


exit on or before: failure 
weight:  f[fweight-w] 





6 total obs. 
exclusions 


6 physical obs. remaining, equal to 
25 weighted obs., representing 
20 failures in single record/single failure data 


19400 total analysis time at risk, at risk from t - 0 
earliest observed entry t - 0 
last observed exit t - 1200 

.list 


hours failures censored w 


بر رحج س uP‏ 





. Stdescribe 
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eat sss‏ مع ]220 ستاتا 


failure _d: failures 
analysis time _t: hours 
weight: [fweight=w] 


per subject لل لتب‎ 


unweighted unweighted unweighted 

Category total mean min median max 
س‎ 
no. of subjects 6 

no. of records 6 1 1 1 1 
(first) entry time 0 0 0 0 
(final) exit time 700 200 700 1200 
subjects with gap 0 

time on gap if gap 0 

time at risk 4200 700 200 700 1200 
failures 5 .8333333 0 1 1 





الأمر 54 يقوم. بتحديد مجموعة من الأوزان التكرارية w‏ في البيانات 
المستخرجة ذات تنسيق esto‏ كما أن الأوامر التي stt fas‏ تقوم تلقائيا 
بالتعرف على هذه الأوزان واستخدامها في أي تحليل لزمن البقاءء ولذلك فإن 
البيانات التي رأيناها سابقا تحتوي على 25 مشاهدة (25 قرصا صلبا) بدلا 

من الوضع السابق وهو 6 (ست فترات زمنية). 
-stsum‏ 


failure _d: failures 
analysis time _t: hours 


weight:  [fweight-w] 


incidence no. of L— Survival time 
time at risk rate subjects 258 50$ 758 





total 19400 .0010309 25 600 800 


1000 


Kaplan-Meier Survivor Functions : yuo  ناآإلباك‎ sla dlos 





بافتراض أن ” تمثل axe‏ المشاهدات التي لا يوجد بها فشل أو مراقبة 
عند بداية الفترة الزمنية dg of‏ تمثل عدد مرات الفشل التي حدثت لتلك 
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المشاهدات خلال الفترة الزمنية or‏ مقدّر كابلان - ميير للبقاء بعد الفترة » هو 
ناتج احتمالات البقاء عند الزمن + والفترات السابقة: 


se)- [] {(n;-4,)=n} [10.1] 


فمثلاً في بيانات مرض نقص المناعة. AIDS‏ التي رأيناها سابقء فإن 
y eee‏ اكا م Giggs Las ST‏ عليه الأعر اشن يعد 56$ رحد قط ia‏ 
التشخيصء ولم تكن هناك مشاهدات مراقبة عند هذه الفترة المبكرةء ولذلك 
فإن احتمالية "البقاء" cl)‏ عدم ظهور أعراض (AIDS‏ بعد الفترة 1 = time‏ هو 
S(1) = )51-1(/51 = 0.9804‏ 
مريض ثان ظهرت عليه الأعراض عند الفترة 2 = dime‏ ومريض ثالث 
عند الفترة 9 — time‏ : 
S(2) = 0.9804 x (51 - 1)/ 51 = 0.9608‏ 
S(9) = 0.9608 x (51 — 1)/51 = 0.9412‏ 
وعند إنشاء رسم بياني للمرضى Si)‏ مع الزمن cr‏ فإن منحنى البقاء 
لكابلان - ميير يظهر كما في الشكل (1.10). برنامج ستاتا يقوم برسم متل 
هذه الأشكال البيانية بشكل تلقائي باستخدام الأمر sts graph‏ فمثلا: 


.use C:\data\aids, clear 
-sts graph 


5 Kaplan-Meier survival estimate 
o 
wo 
P 
o 
o 
2 
eo 


o 
N 
o 


8 
o 


40 60 
analysis lime 


(1.10) الشكل‎ ٠ 
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Mugire ا حصء‎ ee 
المثال الثاني الخاص بدوال البقاء - سوف نتحول إلى البيانات الموجودة‎ 
«1995) Rosner بالملف ما1.d - والتي تم الحصول عليها من دراسة‎ 
المشاهدات الموجودة بالبيانات عبارة عن 234 مدخناً سابقاً يحاولون الإقلاع عن‎ 
يقوم‎ days التدخين» أغلب المدخنين لم ينجحوا في الإقلاع عن التدخين؛ المتغير‎ 
من جديد. وغطت‎ All بتسجيل عدد الأيام ما بين الإقلاع عن التدخين والعودة‎ 
المتغير 8 يشير إلى ما إذا كان الشخص قد عاد‎ Gaal y الدراسة مدة سنة‎ 
أو لم يعد للتدخين‎ (smoking = 1 إلى التدخين قبل نهاية مدة الدراسة ('فشل"‎ 
مع البيانات الجديدة يُفترض أن نبدأ باستخدام الأمر‎ (smoking = 0 "Al o4) 
البيانات جاهزة لتحليل زمن البقاء.‎ Jaal stset 


.uge C:\data\smokingl.dta, clear 








. describe 
Contains data from C:\data\smokingl.dta 

obs: 234 Smoking (Rosner 1995:607) 

vars: 8 2 Jul 2012 06:11 

size: 2,808 

storage display value 

variable name type format label variable label 
a 
id int %9.0g 5 Case ID number 

days int $9. 0g 1 Days abstinent 

smoking byte %9.0g Resumed smoking 

age byte %9.0g Age in years 

sex byte 99 . 09 sex Sex (female) 

cigs byte %9.0g Cigarettes per day 

co int 59 . 06 " Carbon monoxide x 10 

minutes int $9.0g Minutes elapsed since last cig 
Sorted by: 


.Stset days, failure(smoking) 


failure event: smoking !- 0 & smoking > . 
obs. time interval: (0, days] 
exit on or before: failure 


234 total obs. 
0 exclusions 





234 obs. remaining, representing 
201 failures in single record/single failure dara 

18946 total analysis time at risk, at risk from t = 0 

earliest observed entry t - 

last observed exit t 


I 
o 


366 
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الدراسة تتضمن 110 رجال و124 «el pal‏ معدلات الوقوع لكلا الجنسين 
يبدو أنها متشابهة. 





.Stsum, by(sex) 


failure d: smoking 
analysis time _t: days 








incidence no. of حم‎ Survival time 
time at risk rate subjects 258 508 758 








Male 
Female 






8813 
10133 






.0105526 
.0106582 


total 18946 —.0106091 234 4 15 73 


الشكل )2.10( يؤكد هذا التشابه» حيث يُظهر الشكل WGA)‏ بسيطأ بين 
دوال البقاء للرجال والنساء» حيث عاد كلا الجنسين للتدخين من جديد في 
Laon ci ll ad‏ اندها alas) vagi ey‏ غين cuiua‏ كفصن (ess‏ 
كبير خلال فترة ال 30 Leg:‏ الأولى بعد الإقلاع عنه؛ لكلا الجنسين هناك 

احتمال أقل من 9615 .للبقاء كشخص غير مدخن بعد انقضاء سنة. 
ests graph, by(sex) plotilopt (lwidth(medium) )‏ 
plot2opt (lwidth (thick) )‏ 


Kaplan-Meier survival estimates 


o 
e 
= 





0 100 200 300 400 
analysis time 





sex - Male 





sex = Female 


الشكل )2.10( 
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يمكننا اختبار التساوي في دوال البقاء باستخدام اختبار لوغاريتم 
الرتب» وليس غريبا أن هذا الاختبار لم يجد أي اختلاف ذا معنوية إحصائية 
(p = 0.6772)‏ للعودة للتدخين بين الرجال والنساء. 

.8t8 test sex 


failure d: smoking 
analysis time t: days 


Log-rank test for equality of survivor functions 






Events Events 
-observed expected 










Male 
Female 





0.17 
0.6772 


chi2(1) 
Pr»chi2 


Cox Proportional Hazard Models : usos) مادخ امخحاطر السبية‎ 


نماذج الانحدار تسمح لنا بأن نوسع تحليل البقاءء ونختبر تأثيرات 
المتغيرات التنبؤية الطبقية أو المستمرة المتعددة. إحدى الطرق الأكثر 
استخداماً للقيام بذلك تعرف aul‏ انحدار كوكس» وهذه الطريقة تستخدم 
نموذج مخاطرة نسبيا. ومعدل المخاطرة للفشل عند الزمن ؛ يتم تعريفها بانها 
معدل الفشل عند الزمن + بين الذين بقوا حتى الزمن ؛ : 
احتمال الفشل بين الوقت + والوقت t+ At‏ 
[2.10] م ري SS‏ 
(احتمال الفشل بعد الوقت (Ar) (r‏ 
نقوم بصياغة نموذج لمعدل المخاطرة Alas‏ لخط الخطر الأساسي (ho)‏ 
عند الوقت ؛ وتأثيرات واحد أو أكثر من متغيرات + : 
A(t) = ho (t) exp(Bixi + Baxa +... + Bax). [a10.3]‏ 
وهذا GAS:‏ 
In[^(t)]- In[, )0[ exp(Bixi + Box; + ... + Bers) [b10.3]‏ 
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'خط الخطر الأساسي" يعني أن الخطر لمشاهدة ما مع كل متغيرات x‏ 
يساوي صفرا. انحدار كوكس يقوم بتقدير هذا الخط بطريقة لامعلمية: 
ويحصل على تقدير الأرجحية العظمى ل 8 لمعلمات المعادلة [10.3]. الأمر 
stcox‏ هو إجراء يقوم بعرض نسب المخاطرة والتي هي عبارة عن تقديرات 
cexp()‏ وهي تشير إلى التغيرات النسبية إلى معدل خط الخطر الأساسي. 

هل يؤثر العمر على بداية أعراض مرض نقص المناعة fAIDS‏ ملف 
البيانات aids.dta‏ يتضمن معلومات تناقش هذا السؤال. يجب ملاحظة أن 
الأمر steox‏ - يختلف عن أغلب أوامر صياغة نماذج ستاتا - حيث إننا 
سنقوم بإدراج المتغير أو المتغيرات المستقلة فقط» أما المتغيرات التابعة؛ 
ومتغيرات الوقت» ومتغيرات المراقبة فإن ستاتا يفهمها بشكل تلقائي عند 
استخدام الأمر .stset‏ 

.Stcox age, nolog 


failure d: aids 
analysis time _t: time 


id: case 
Cox regression -- Breslow method for ties 
No. of subjects - 51 Number of obs = 51 
No. of failures = 25 
Time at risk = 3164 
LR chi2(1) = 5.00 
Log likelihood = -86.576295 Prob » chi2 = 0.0254 








Haz. Ratio Std. Err. z P» |z| (95% Conf. Interval] 





1.084557 .0378623 2.33 





0.020 1.01283 1.161363 






قد نقوم بتفسير معدل المخاطرة المقدر وهو 1.084557 مع الإشارة إلى 
شخصين مصابين بمرض HIV‏ اعمارھما ۾ و.1+ه» الشخص الأكبر سنأ يكون 
أكثر عرضة لظهور أعراض مرض AIDS‏ بنسبة %8.5 خلال فترة أقصر 
(المعدل الخاص بالمخاطر هو 1.084557( E CIE cl Via‏ 
معنوية إحصائية )0.02 = (p‏ عن 1. إذا كنا نريد شرح نتائجنا لفرق خمس 
سنوات في السن» فإننا سوف نتساعل عن معدل المخاطر للأس 5 كما يلي: 
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.display exp( b[agel)^5 
1.5005865 
عندما‎ %50 sai أعلى‎ AIDS Gaye فإن خطر بداية الإصابة‎ Aly 
يكون الشخص الثاني أكبر بخمس سنوات من الشخص الأولء وبدلاً من ذلك‎ 
نفس الشيء (ونحصل على فترة ثقة جديدة) بتكرار‎ asi فإنه بالإمكان أن‎ 
بحيث يتم القياس على أساس 5 سنوات»ء‎ cage الانحدار بعد تحوير متغيرالعمر‎ 
يمنع عرض السجل المتكرر وشرح البيانات -)و‎ nolog noshow الخيار أدناه‎ 


.generate age5 = age/5 
label variable age5 "age in 5-year units" 
.Stcox age5, nolog noshow 


Cox regression -- Breslow method for ties 


No. of subjects = 51 Number of obs = 51 
No. of failures = 25 
Time at risk = 3164 


LR chi2(1) 5.00 


Log likelihood = -86.576295 Prob > chi2 = 0.0254 







Haz. Ratio Std. Err. z P»|z| [95$ Conf. Interval] 





1.500587 .2619305 1.065815 2.112711 


مشابهاً للانحدار العاديء فإن نماذج كوكس يمكن أن يكون لها أكثر من 
متغير مستقل واحد. وباستخدام ملف البيانات heart.dta‏ الذي يحتوي على 
بيانات زمن بقاء من دراسة Selvin‏ (1995) ل 35 TONER‏ لديهم مستويات 
مرتفعة جدا من الكليسترول» فإن متغير !3 time ye‏ يوضح axe‏ الأيام لكل 
مريض كان تحت المتابعة. والمتغير coronary‏ يشير إلى ما إذا كانت 
النوبة القلبية قد حدثت في نهاية فترة المتابعة )1 ع (coronary‏ أو لم تحدث 
(coronary = 0)‏ البيانات تتضمن أيضا مستويات الكليسترول وعوامل اخری 
يُعتقد بأن لها تأثيرًا على مرض القلب» ملف البيانات heart.dta‏ تم إعداده 
لتحليل زمن still‏ عن طرق «stset time, failure(coronary) si‏ ولذلك 
يمكننا أن نقوم باستخدام تحليل st‏ مباشرة. 
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.describe patient-ab 





storage display value 
variable name type format label variable label 
patient byte %9.0g Patient ID number 
time int $9.0g Time in days 
coronary byte — $9.0g E Coronary event (1) or none (0) 
weight int $9. 0g Weight in pounds 
sbp int $9. 0g Systolic blood pressure 
chol int $9.0g Cholesterol level 
cigs byte %9.0g Cigarettes smoked per day 
ab byte %9.0g Type A (1) or B (0) personality 


.Stdescribe 


failure _d: coronary 
analysis time _t: time 


|}—______— per subject 


Category total mean : min median max 
no. of subjects 35 1 

no. of records 35 1 1 1 1 
(first) entry time 0 0 0 0 
(final) exit time 2580.629 713 2875 3141 
subjects with gap 0 

time on gap if gap 0 

time at risk 90322 2580.629 713 2875 3141 
failures 8 .2285714 0 0 1 





انحدار كوكس any‏ أن مستوى الكليسترول والتدخين Lea‏ يزيدان بشكل- 
كبير من مخاطر النوبة القلبية. وبعكس المتوقعء فإن زيادة الوزن تؤدي إلى 
تخفيض مخاطر النوبة القلبيةء LÍ‏ ضغط الدم ونوع الشخصية A/B‏ ليس لهما 
تأثير ذو معنوية إحصائية. 


.Stcox weight sbp chol cigs ab, noshow nolog 
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aU‏ ي ات ع nsu cud c eg ee‏ 


Cox regression -- no ties 
No. of subjects - 35 Number of obs z 35 
No. of failures - 8 
Time at risk z 90322 

LR chi2(5) = 13.97 
Log likelihood = -17.263231 Prob > chi2 = 0.0158 













(95$ Conf. Interval] 








. 9349336 - 0305184 .8769919 .9967034 





sbp 1.012947 .0338061 0.39 0.700 .9488087 1.081421 
chol 1.032142 .0139984 2.33 0.020 1.005067 1.059947 
cigs 1.203335.  .1071031 2.08 0.038 1.010707 1.432676 

3.04969 2.985616 1. .4476492 20.717655 





بعد تقدير النموذج يمكننا توقع predict‏ متغيرات جديدة تحتفظ بخط 
الخطر الأساسي التراكمي ودوال البقاء. وبما أن الخط الأساسي يشير إلى 
الوضعية التي تكون عندها كل متغيرات × تساوي صفراء ويجب علينا أولا 
القيام بتمركز بعض المتغيرات حتى تكون e‏ صفر لها معنىء فالمريض 
الذي وزنه صفر باوند أو ضغط دمه صفر ليس له فائدة عند إجراء عملية 
المقارنةء وباستخدام أصغر القيم في البيانات الموجودة لديناء فإنه يمكننا أن 
نقوم بعملية تحوير لمتغير الوزن weight‏ بحيث يشير الصفر إلى 120 355« 
وصفر للمتغير sbp‏ يشير إلى 6105 وصفر للمتغير schol‏ إلى 340: 
summarize patient- ab‏ . 


Variable 





Obs Mean Std. Dev. Min Max 











patient 18 10.24695 
time 35 2580.629 616.0796 773 3141 
coronary 35 .2285714 .426043 0 1 
weight 35 170.0857 23.55516 120 225 


sbp 129.7143 







14.28403 





35 369.2857 51.32284 343 645 
35 17.14286 13.07702 0 40 
35 5142857 .5070926 0 1 


cigs 
ab 


.replace weight - weight - 120 
.replace sbp = sbp - 105 pP) 
replace chol = chol - 340 
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.Summarize patient - ab 


Variable 












18 10.24695 











patient 


time 35 2580.629 616.0796 773 3141 
coronary 35 . 4 . 426043 0 1 
weight 35 50.08571 23.55516 0 105 
sbp 35 24.71429 14.28403 -1 49 







29.28571 51.32284 
35 17.14286 13.07702 0 40 
35 .5142857 .5070926 0 1 





cigs 
ab 


قيم صفر لكل متغيرات + يكون لها معنى حقيقي الآن. ولإنشاء متغيرات 
جديدة تحتوي على الخط الأساسي للبقاءء وتقديرات Alla‏ الخطر التراكميء 
فإننا نقوم بتكرار الانحدارء ونتبع ذلك بأمرين US predict‏ يلي: 

.Stcox weight sbp chol cigs ab, noshow nolog 


.predict hazard, basechazard 
.predict survivor, basesurv 


Cox regression -- no ties 
No. of subjects - 35 Number of obs = 35 
No. of failures = 8 
Time at risk = 90322 

LR chi2(5) = 13.97 
Log likelihood = -17.263231 Prob » chi2 z 0.0158 
















. Ratio [95$ Conf. Interval] 





weight .9349336 .0305184 -2.06 0.039 .8769919 .9967034 


sbp 1.012947 .0338061 0.39 0.700 .9488087 1.081421 
chol 1.032142 .0139984 2.33 0.020 1.005067 1.059947 
cigs 1.203335 .1071031 2.08 0.038 1.010707 1.432676 

ab 3.04969 2.985616 1.14 0.255 .44 2 20.77655 








€ 


cJ Alias Ga,‏ إنشاء ad yale Cd aie AD‏ تار uode.‏ تنسب 

المخاطرة والأخطاء المعيارية وغيرها من الإحصائيات الأخرى. pa‏ 
predict‏ تقوم بإنشاء متغيرات جديدة ويتم تسميتها عشوائيا بأسماء hazard,‏ 
survivor‏ و elay‏ رسم بياني يمثل دالة الخط الأساسي للبقاءء فإنتانقوم 
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بإنشاء رسم بياني للمتغير survivor‏ مع المتغير ime‏ ثم نقوم بتوصيل النقاط 

بطريقة تشبه السلالم كما تظهر ost‏ الشكل (3.10). 

.graph twoway line Survivor time, 
connect(stairstep) sort 


$ 
5 
2 
T 
o 
£ 
8 
B, 
o 
[^] 
eo 
500 1000 1500 2000 2500 3000 
Time in days 
(3.10) الشكل‎ 


دالة الخط الأساسي للبقاء - والتتي تصف احتمالات البقاء للمرضى الذين 
وزنهم صفر )120 «(adsl‏ وضغط pall‏ صفر (105) والكليسترول صفر 
)340(« ولايدخنون» وهم أشخاص من نوع الشخصية 8- تنخفض مع 
الوقت» وبالرغم من أن هذا الانخفاض يبدو كبيرا las‏ في الجانب Gal‏ من 
الرسم فإنه من الملاحظ أن الانخفاض حقيقة كان من 1 إلى نحو 0.96. 
وبالنظر إلى القيم الأقل تفضيلاً للمتغيرات التنبؤية» فإن احتمالات البقاء كان 
من المفترض أن تكون أكثر انخفاضاً. 

نفس الشكل البياني لدالة الخط الأساسي للبقاء كان يمكن الحصول عليها 
بطريقة أخر ى بدوّن الأمر «مم؛وء وهذه الطريقة تم استخدامها لإنشاء الشكل 
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)4.10( حيث إنها تستخدم الأمر sts graph‏ مع الخيارات «adjustfor()‏ ثم بعد 
ذلك يتم إدراج المتغيرات التنبؤية. 
.sts graph, adjustfor (weight sbp chol cigs ab)‏ 


Survivor function 
adjusted for weight sbp chol cigs ab 


de 


1.00 


pd 
e 
5 
eo 
a 
o 
e 
o 
e 
0 1000 2000 3000 
analysis time } 
(4.10) الشكل‎ 


الشكل (4.10)- يختلف عن الشكل )3.10( - حيث 43 يعرض دالة 
البقاء العادية مع تقسيم قياس المحور العمودي ليكون من 0 إلى 1ء مع وجود 
هذا الاختلاف في القياس بالمحور العمودي. الشكل (3.10) والشكل (4.10) 
يعرضان نفس المنحنى. 

الشكل )5.10( يعرض رسماً بيانياً لخط الخطر الأساسي التراكمي مع 
الوقت باستخدام المتغير hazard‏ والذي تم إنشاؤه بالأمر OSA cstcox‏ يوضح 
بأن خط الخطر الأساسي التراكمي قد ازداد عند 8 نقاط oY)‏ 8 مرضى 
'فشلوا" أو حدثت لهم نوبة قلبية) من 0 Ls‏ إلى 0.033. 


graph twoway connected hazard time, 
connect(stairstep) sort msymbol(Oh) 
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3 


.02 .03 


cumulative baseline hazard 


.01 


500 1000 1500 2500 3000 


2000 
Time in days 
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: والاتحدار الأسى‎ Weibull dyg just 
Exponential and Weibull Regression 


انحدار كوكس يقوم بتقدير Alla‏ خط الخطر الأساسي بدون الإشارة إلى 
أي توزيع نظري. هناك العديد من المداخل المعلمية الأخرى تبدأ من 
افتراضات GL‏ أزمنة البقاء تتبع توزيعات نظرية معروفة. هذه التوزيعات 
تتضمن التوزيع الأسّيء وتوزيع cus‏ والتوزيع اللوغاريتمي الطبيعي»› 
والتوزيع اللوغاريتمي الثنائي» وتوزيع جومبرتزء أو توزيع جاما المعياري. 
النماذج التي يتم إنشاؤها Sly‏ على أي من هذه التوزيعات يمكن اس تخدامها 
مع الأمر estreg‏ ومثل هذه النماذج لها نفس الصيغة العامة لانحدار كوكس 
(المعادلتان [2.10] و [3.10]) ولكنها تعرّف الخط الأساسي للخطر ho = (f)‏ 
بطريقة مختلفة. هناك مثالان عن ذلك سوف يتم تناولهما في هذا الجزء. 

إذا حدث الفشل بطريقة مستقلة مع خطر ثابت عند أزمنة بقاءء وهذا 
الحدث يتبع توزيع (ur‏ فإنه بالإمكان تحليله باستخدام الانحدارٍ eal‏ الخطر 
الثابت يعني الأفراد المشاركين في الدراسة ليسوا أكثر احتمالا أو أقل عرضة 
للفشل في آخر مدة المشاهدة عنهم في بدايتها. لفترة طويلة هذه الفرضية لم 
تكن مُبررة للآلات والكائنات الحيةء ولكن يمكن إيقاف تأثيرها إذا كانت فترة 
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Sb oia‏ قطي bana 12 ja.‏ فا من فر ات الحياة» النموذج الأسَي يعتمد 
على أن لوغاريتمات دالة البقاء - (5()0)م1 - ترتبط tae Ghs‏ 


المدخل المعلمي الثاني الشائع وهو انحدار ويبل» والذي يعتمد على 
توزيع أكثر عموماء وهو توزيع ويبلء هذا لايتطلب أن تكون معدلات الفشل 
ثابتة» ولكن يسمح لهذه المعدلات بالزيادة أو النقص بشكل سلس خلال فترة 
من الزمن» نموذج ويبل يفترض Gb‏ ((1205)0-)1 هو دالة خطية ل ()1. 
الرسومات البيانية د تعتبر وسيلة تشخيصية مفيدة لمعرفة مدى ملاءمة نماذج 
ويبل أو النماذج الأسّية. فمثلاً وبالعودة إلى ملف بيانات aidsdia‏ تقوم بإنشاء زسم 
بياني )0&3 6.10( In(S()) E!‏ مقابل الزمن وذلك بعد إنشاء تقديرات كابلان- 
ميير لدالة البقاء 5)0» توصيفات المحور العمودي في الشكل )6.10( تم إعطاؤها 
رقمين ثابتين مع تنسيق يعرض Lady‏ واحذا بعد الفاصلة %21( ويكون اتجاه هذه 
الأرقام «Lal‏ وذلك حتى يمكن قراءتها بوضوح. 
.sts gen S= S‏ 
.generate logS = l1n(S)‏ 


graph twoway scatter logS time, 
ylabel(-.8(.1)0, format (%2.1f) angle (horizontal)) 


logS 
ò 
^ 
° 


Months since HIV diagnosis 


الشكل )6.10( 
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نمط الشكل )6.10( يبدو Ls‏ بطريقة ما مما يدفعنا إلى محاولة الانتقال 
إلى انحدار iq‏ 


.Streg age, dist(exponential) nolog noshow 


Exponential regression -- log relative-hazard form 
No. of subjects = 51 Number of obs = 51 
No. of failures = 25 
Time at risk = 3164 

LR chi2(1) = 4.34 
Log likelihood = -59.996976 Prob > chi2 = 0.0372 







Haz. Ratio Std. Err. z P» |z| (95$ Conf. Interval] 



















1.008028 
.000069 


1.145172 
.0067191 


.0349626 
.0007954 


2.21 
-6.24 


1.074414 
.0006811 






معدل الخطر )1.074( والخطأ المعياري )0.035( تم تقديرهما بواسطة 
الانحدار الأسّي أعلاه لا تختلفان بشكل كبير عن نظائرها في انحدار كوكس 
الذي قمنا به سابقاً )1.085 و 0.038). هذا التشابه يعكس درجة الترابط بين 
ala‏ الخطر التجريبية والخطر الثابت والذي تم إنشاؤه بواسطة التوزيع 
الأستي» Sling‏ على هذا النموذج الأسيء فإن خطر إصابة الشخص بمسرض 
HIV‏ وظهور أعراض مرض AIDS‏ تزداد بنحو %7.4 مع كل سنة زيادة 
في العمر. 

بعد إجراء الحسابات بالأمر streg‏ سوف نقوم بإنشاء رسم بياني 
باستخدام الأمر steurve‏ لنموذج الخطر التراكمي ودالة الخطر أو دالة البقاءء 
والوضع الافتراضي هو أن يقوم الأمر steurve‏ برسم هذه المنحنيات مع 
الاحتفاظ بكل قيم المتغيرات x‏ في النموذج عند متوسطاتها. ويمكننا تحديد قيم 
د الأخرى باستخدام الخيار cat)‏ وتجب الملاحظة أن بيانات الأشخاص 
الموجودة في الملف aids.dta‏ تتراوح ما بين 26 إلى 50 سنةء ويمكننا إنشاء 
رسم بياني لدالة البقاء عندما يكون العمر 26 - age‏ وذلك باستخدام أمر مثل: 


.Stcurve, surviv at(age = 26) - 


` 
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الشكل البياني يمكن أن يصبح ASÍ‏ تنسيقا باستخدام الخيار atio‏ والخيار 
20 لعرض isis‏ البقاء باستخدام نوعين من he × ad‏ أعلى وأقل قيمة 
لمتغير age‏ كما يلي: 


.Stcurve, survival ati(age = 26) at2(age = 50) 
lpattern(dash solid) 


Exponential regression 





40 60 
analysis time 





age = 50 
(7.10) الشكل‎ 


الشكل )7.10( يعرض منحنى البقاء المتوقع Q ail)‏ من HIV‏ ويتم 
تشخيصه (AIDS‏ وهو ينخفض بدرجة كبيرة بين المرضى المُسنين» حيث 
معدل المخاطرة الجوهري بالنسبة للعمر age‏ وهو أكبر من 1 في جدول 
التوزيع الأسّي له نفس المعنى» ولكن باستخدام الأمر stcurve‏ مع الخيارين 
at20 5 10‏ فإن القيم تعطي شرحا Liye‏ للتأثير أكثر قوة من الجدول. هذه 
الخيارات تعمل بطريقة ة مشابهة مع الأنواع الثلاثة لأمر الرسم البياني steurve‏ 


Alla stcurve, survival‏ البقاء 


Alla stcurve, hazard‏ الخطر 
Ala stcurve, cumhaz‏ الخطر التراكمي 
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وبدلا من التوزيع GLY‏ يمكن للأمر streg‏ صياغة gila‏ بقاء تعتمد 
على توزيع ويبل. وتوزيع ويبل قد يبدو غير خطي في الرسم البياني 
ل In(S())‏ مقبل الزمن »١‏ ولكن يُفترض أن يظهر بشكل خطي في الرسم 
البياني ل ((17)5)0-)10 مقابل In)‏ مشابها للشكل (8.10). ومن ناحية 
«s al‏ فإن التوزيع GINE‏ سوف يظهرخطياً في كلا الشكلين البيائيين مع 
ميل يساوي 1 في ((10)5)0-)17 مقابل الرسم البياني ل 15)0. وفي الحقيقة 
فإن بيانات المرضى في الشكل (8.10) قريبة من العلاقة الخطيّة مع ميل 
يساوي el‏ وهذا يعني أن النموذج GUY‏ السابق كان AMS‏ 
.generate loglogs ln(-1n(S))‏ 
.generate logtime ln(time)‏ 


-graph twoway scatter loglogS logtime, 
ylabel(,angle(horizontal)) 
L] 





logtime 


الشكل )8.10( 


cat,‏ فإننا لانحتاج إلى تعقيدات ssl‏ نموذج من نماذج ويبل مع 
هذه البيانات والنتائج تم عرضّها بالجدول أدناه. 
-Streg age, dist (weibull) noshow nolog‏ 
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Weibull regression -- log relative-hazard form 
No. of subjects - 51 Number of obs = 51 
No. of failures = 25 
Time at risk = 3164 

LR chi2(1) = 4.68 
Log likelihood = -59.778257 Prob » chi2 z 0.0306 











Haz. Ratio Std. Err. 2 P»|z| [95$ Conf. Interval] 

















1.153127 
.0081564 


1.010531 
.0000135 


.0363509 
.0005415 


1.079477 
.0003313 






.4801454 





-.2336179 





.1232638 .1820858 
















1.616309 
1.263162 


.7916643 
.6186934 


'.,2059723 
.1609694 


1.131183 
.8840305 






انحدار ويبل يحسب معدل المخاطرة ويقدرها ب )1.079( وهو يتوسط 
بين نتائج كوكس السابقة والنتائج الأسّية. الاختلاف الأكثر وضوحا في النماذج 
السابقة» هو وجود ثلاثة خطوط جديدة في أسفل الجدول» وهي تشير إلى معلمة 
شكل توزيع ويبل م. وعندما تكون قيمة م تساوي cl‏ فإن ذلك يعني أنها تتعلق 
بنموذج أسّيء والمخاطر لاتتغير بمرور الزمن. Ld‏ إذا كانت 1 <م فهذا يشير" 
إلى أن المخاطر تزداد مع الوقت» وفي حالة أن 1 >م فهذا يعني أن المخاطر 
تنخفض» وفترة Ag‏ %95 لمعلمة توزيع ويبل م تتراوح ما بين 0.79 و1.62 
ولذلك فليس لدينا أي سبب لرفض النموذج الأسّي (1 = (p‏ هناء نموذج Sy‏ 
يركز على م/1 In(p) p,‏ هذا التركيز يتم بشكل مختلف» ولكن رياضيا متساوي» 
ولذا فإن برنامج ستاتا يوفر هذه الطرق الثلاثء فالأمر steurve‏ يقوم بإنشاء 
رسم بياني لدوال المخاطرة التراكمية» أو دوال المخاطرء أو دوال البقاء i—‏ 
streg, dist(weibull) FaN‏ كالذي تم القيام بهبعدالأمر streg,‏ 
dist(exponenetial)‏ أو النماذج الأخر ى ل -streg‏ 

الانحدار الأسّي أو انحدارِ ويبل. أكثر تفضنيّلاً من انحدار كوكس عندما 
تكون أزمنة البقاء تتبع توزيعا Lid‏ أو توزيع ويبل. ولكن: عند صياغة نماذج 
الانحدار هذه بطريقة خاطئةء فإننا سوف نحصل على نتائج مضللة. انحدار 
كوكس- والذي لايعتمد على أي افتراضات سابقة حول شكل التوزيع - يبقى 
الأداة المفضلة في حالات كثيزة. 
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بالإضافة إلى النماذج الأسية ونماذج ويبلء فإنه بالإمكان استخدام الأمر 
streg‏ في صياغة العديد من النماذج التي تعتمد على توزيع جومبرتزء. 
والتوزيع اللوغاريتمي الطبيعي» والتوزيع اللوغاريتمي الثنائي» وتوزيع جاما 
المعياري. وللحصول على معلومات أكثر حول تركيبة الأمر وخياراته» قم 
بطباعة الأمر help streg‏ أو الاطلاع على دليل المستخدم Survival Analysis‏ 
-and Epidemiological Tables Reference Manual‏ 
jll‏ بواسون : Poisson Regression‏ 

13 كانت الأحداث تقع بشكل مستقل وبمعدل ثابت» فإن عدد الأحداث 
خلال فترة معينة من الزمن» تتبع توزيع بواسون. بافتراض أن r,‏ تمثل معدل 
الوقوع فإن: 


عدد الأحداث 
r=‏ 


]59[ عدد مرات احتمال وقوع الحدث 


المقام في المعادلة أعلاه ]104[ يُطلق عليه "التعرتض" وفي العادة يتم 
الوقوع كدالة خطيّة لواحد أو أكثر من المتغيرات التنبؤية: 


In(r) = Bo + Bixi + B2 x2 +... + يديع‎ [a5.10] 
وبنفس الطريقة» فإن النموذج أعلاه يشرح لوغاريتمات وحدات الأحداث‎ 
3 المتوقعة:‎ 


Bo + Bi xi tox... + By x, [b5.10]‏ + (التعرّض )ص1 = (العدد المتوقع)ها 

وبافتراض أن التقدم في توزيع بواسون يوضح الحدث المراد دراستهء 
فإن انحدار بواسون سوف يحسب تقدير الاحتمال الأعلى لمعلميات 8. 

سوف يكون لدينا مثال يحتوي على بيانات عن التعرض للإشعاعات 
والموت بمرض السرطان بين عمال المعمل الوطني في أوك ريدج بالولايات 
المتحدة هناك 56 مشاهدة بملف البيانات Ba oakridege.dta‏ 56 عمر/ فئة 
تعرضت Old 7) gum‏ عمرية X‏ 8 فئات تعرضت للإشعاع)ء لكل 
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مجموعة نحن نعرف aae‏ حالات الوفاة» وعدد الفئات العمرية المتعرضة 











للاشعا 
z‏ € 
.use C:\data\oakridge.dta, clear‏ 
.describe‏ 
Contains data from C:\data\oakridge.dta‏ 
obs: 56 Radiation (Selvin 1995:474)‏ 
vars: 4 2 Jul 2012 06:11‏ 
size: 392‏ 
storage display value‏ 
variable name type format label variable label‏ 
age byte $9.0g ageg Age group‏ 
rad byte $9.0g Radiation exposure level‏ 
deaths byte &9.0g Number of deaths‏ 
pyears float %9.0g Person-years‏ 
Sorted by:‏ 
Summarize‏ . 
Variable ‘Obs Mean Std. Dev. Min Max‏ 
age 56 4 2.0181 1 7‏ 
rad 56 4.5 2.312024 1 8‏ 
deaths 56 1.839286 3.178203 0 16‏ 
pyears 56 3807.679 10455.91 23 71382‏ 


.list in 1/6 


rad deaths pyears 


wn PWN [D 





. هل معدل الوفيات زاد مع التعرض للإشعاع؟ انحدار. بواسون وجد أن 
هناك 136 ذا معنوية إحصائية: 


. poisson deathsrad, 201096 exposure(pyears) irr 
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Poisson regression Number of obs = 56 
LR chi2(1) = 14.87 
Prob » chi2 = 0.0001 
Log likelihood = -169.7364 Pseudo R2 = 0.0420 












P>|z| (95$ Conf. Interval] 





1.236469 .0603551 4.35 0.000 1.123657 1.360606 
.000288 .0000483 -48.65 0.000 .0002074 .0004 
1 (exposure) 





rad 
_cons 






lnípyears) 


بالنسبة لتحليل الانحدار أعلاه قمنا بتحديد عدد مرات وقوع الحدث 
(deaths)‏ كمتغير qui‏ والإشعاع (rad)‏ كمتغير مستقل. متغير التعرض 
لبواسون هو pyears‏ أو شخص/ سنة في كل فئة للمتغير cad‏ الخيار irr‏ يقوم 
بعرض نسب معدل الوقوع بدلاً من مُعَاملات الانحدار في جدول النتائج؛ 
حيث حصلنا على Ya exp(f)‏ من قيمة 8 فقط وهو الوضع الافتراضي. 
وحسب نسبة معدل الوقوع» فإن معدل الوفيات أصبح 1.236 مرة أعلى 
(زيادة بنسبة 9623.6( مع كل زيادة في فئة الإشعاع» وبالرغم من أن ذلك 
المعدل ذو معنوية إحصائيةء فإنه غير متناسب بدرجة كبيرة» حيث إن R‏ 
الوهمية (المعادلة [9.4]) تساوي 0.042 فقط. 
وللقيام باختبار حُسن المطابقة الذي يقوم بمقارنة توقعات نموذج بواسون 
مع الأعداد المشاهدة نقوم باستخدام أمر ما بعد التقدير -estatgof‏ 
.estat gof‏ 


Deviance goodness-of-fit = 254.5475 
Prob > chi2(54) = 0.0000 
Pearson goodness-of-fit = 419.0209 
Prob > chi2(54) = 0.0000 


نتائج اختبار حُسن المطابقة تشير إلى أن توقعات النموذج تختلف بدرجة 
كبيرة عن الأعداد الحقيقية. وهذه إشارة Goal‏ إلى أن النموذج سئ بدرجة 
كبيرة. 


A 


e 
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يمكننا الحصول علي نتائج أفضل عندما لقوم بإدراج المتغير ge‏ 
كمتغير تلبؤي. حيث تزداد قيمة ۸ الوهمية لتكون 60,5966 كما أن اختبار 
خسن المطابقة لا يقود إلى رفض اللموذج, 


poisson deaths rad age, nolog exposure(pyears) 
irr 


Poisson regresaion ١ Number of obs s 86 
UR chi2(3) 2 411,4 
Prob > ohi? " 0.0000 
log likelihood = -71.4653 Pseudo R32 3 0.5965 

















deaths Std, Err, [95% Conf, Intervall 










rad 
age 

008 
ln(pyeara) 





1.176673 — .0893446 0,001 1.065924 3,498939 
1.960034 — .0997536 13.24 0.000 2.773955 2.165631 
.0000297 9,08e-06 -34.10 0,000 10000363 10000539 

1 (exposure) j 





poisgof 
Deviance goodness-of-fit = 64 
Prob > chi2(53) = 0.2960 


Pearson goodness-of-fit a 51.91816 
Prob > ohia(53) 9 0.8163 


حتى الآن قمدا بمعاملة المتغير rad‏ والمتغير age‏ كألهما متغيسران 
متصلان؛ « ولحن لتوقع أن تأثيرهما على معدل الوفيات سوف يكون Dii‏ 
shad‏ وفي الحقيقة كلا المتغيرين الاين تم قياسهما كفئات مرتبة؛ فمثاد 
علدما تكون 1 = rad‏ فهذا بعلي 0 تعرّض للإشعاع؛ 2 = rad‏ يعني أله من 0 
إلى 19 مللي؛ 3 = rad‏ يعني من 20 إلى 39 ulla‏ وهكذاء الطريقة البديلة 
لإدراج فئات التعرض للإشعاع في تحليك الالحدار لإيجاد التأثبرات غير 
الخطيّة يتم من خلال إدراجها كمجموعة متغيراتٍ تلبوية باستخدام تسدوين 
المتغير العاملي ببرنامج ستاتاء المصطلح irad‏ في اللموذج أدناه يفوم بتحديد 
)1 ,0( كمؤشر لكل فئة للمتغير 4ه تم إدراجها مع المتغير التنبؤي «age‏ 
وعندما تكون 1 «ji rado‏ يتم إهمالها تلقائيا ويتم اعتبارها فئة أساسية. 
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.poisson deaths i.radage, nolog 
exposure(pyears) irr 


Poisson regression Number of obs z 56 
LR chi2(8) z 215.44 
Prob » chi2 z 0.0000 
Log likelihood - -69.451814 Pseudo R2 = 0.6080 










deaths IRR Std. Err. z P»|z| (95$ Conf. Interval] 
















2 1.473591 -426898 0. . 4 2.599975 

3 1.630688 .6659257 1.20 0.231 .732428 3.630587 

4 2.375967 1.088835 1.89 0.059 .9671429 5.833389 

5 .7278113 :.7518255 -0.31 0.758 .0961018 5.511957 

6 1.168477 1.20691 0.15 0.880 .1543195 8.847472 

7 4.433729 3.337738 1.98 0.048 1.013863 19.38915 

8 3.89188 1.640978 3.22 0.001 1.703168 8.893267 
age 1.961907 .1000652 13.21 0.000 1.775267 2.168169 
-cons .0000295 .0000106 -29.03 0.000 .0000146 .0000597 


lIn(pyears) 





1 (exposure) 





هذا التعقيد الإضافي لنموذج المتغير التنبؤي ali‏ بجعل النموذج أكثر 
ملاعمة» حيث أضاف إلى تفسير النتائج. فالتأثير الكلي للإشعاع على معدل 
الوفيات يبدو أنه كانت نتيجة أساسية لأعلى مستويين من مستويات الإشعاع 
rad 8 cad - 7)‏ وهي ترتبط ب 100 إلى 119 و120 مللي)؛ وعند هذه 
المستويات» فإن معدلات الوقوع تكؤن أعلى بأربع مرات تقريبا. 
مستويات الإشعاع 7 و8 يبدو أن لها تأثيرات متشابهةء ولذا فإننا قد 
نبستط النموذج من خلال توحيد هذه المستويات. أولا سوف نختبر ما إذا 
كانت المُعاملات تختلف بشكل جوهريء وهي في الحقيقة لا تختلف بشكل 
جوهري: 
.test 7 . 230 = 8.rad‏ 


( 1) [deaths]7.rad - [deaths]B.rad - 0 


chi2( 1) 0.03 
Prob > chi2 = 0.8676 QT 


الفصل العاشر : تماذج عد الأحداث واليقاء 483 





ثم بعد ذلك نقوم بإنشاء متغير وهمي جديد باسم rad78‏ وهو يساوي 1 
إذا كان rad‏ يساوي 7 أو 8 ونستخدم هذا المتغير الجديد بدلا من المؤشرات 
rad =7‏ و8 = cad‏ الأوامر أدناه توضح كيف يمكننا القيام بذلك في تدوين 

.generate 22078 = (7.rad | 8.rad) 


.poisson deaths i(1/6).radrad78age, irr 
ex(pyears) nolog 


foissca regressic- Nunez si cks = ss 
LE سك‎ T z 215.41 
Prcb > chiz = Gece 
Log Likelibocd = -م-‎ 2 Pse-ci- RI = 28253 








3 1.34 7 
Z 2.230 22 
ass 2.89 ay 
38 ae S; 
42 9.15 Ss 
+ 7.43 2.692 Sas 
E 13.21  C.COC z. 
EES ما" عد د‎ STE 





يمكننا الاستمرار في تبسيط النموذج أكثر بنفس هذه الطريقةء وفي كل 


خطوة فن الامر test‏ يساعدنا فى تقييم ما إذا كان توحيد متغيرين وهميين 


er 


يمكن تبریره. 


Generalized Linear Models : النصاذخ الخطية العامة‎ 


النماذج الخطية العامة (GLM)‏ تكون صيغتها كما يلي: 
Bo + Bixi + Bata + ... + Bex F [6.10]‏ = [(س)طاع 
حيث إن [ gf‏ عبارة عن دالة الربط F‏ مجموعة التوزيع» وهذه الصيغة 
العامة تتضمن العديد من للتمادج المحددة. فعلى سبيل المثالء إذا كانت [ ]ع 
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هي دالة الوحدة؛ ور تتبع توزيعاً طبيعياً (جارس)؛ فإن صيغة نموذج الانحدار 
الخطي تكون؛ 
]7.10[ توزيع طبيعي BO) = Bo + Pixi + Baxa + ... Ben‏ 

وإذا كانت [ gp‏ دالة لوغاريتمية؛ e yy‏ توزيع برئولي؛ فإن صيفة 
نموذج الالحدار اللوغاريتمي تكون؛ 

Loglt[E(j)] = Bo + Bui + Bata + ... + Brenly توزيع‎ [8.10] 

وحيث إن هذا النموذج قابل للتطبيق في مجالاث dae‏ فإن OLM‏ كان 
يمكن استخدامه في أجزاء مختلفة من هذا الكتاب؛ وعلاقة OLM‏ بهذا النصل 
uit‏ من فدرته على التئاسب مع لماذج الأحداث. نمثلا الحدار بواسون 
يتطلب أن تكون Ma g[]‏ لوغاريتم طبيعي؛ وأن «ريتبع توزيع بواسون. 

]9.10[ توزيع بواسون سوسم + ... + Bo + Bixi + Bor‏ = [(س)8]ما 

وكما هو algia‏ مع كل طريفة مرئة؛ فإن الأمر gim‏ ببرنامج ستانا 
يسمح بالعديد من الخياراث. والمستخدمون يمكلهم تحديد ليس فقط نوع 
Alloy 929‏ الربط؛ Lad] y‏ إيضاً تفاصيل تقدير coal‏ والإجراء الملاسب» 
والمخرجات والتعرّض. هذه الخيارات تجعل الأمر PN gim‏ مفيذا حتی عند 
تطبيقه على النماذج التي لها أوامر خاضة بها iaa $390 ya‏ (مثل regress,‏ 
(logistic, poisson‏ , 


يمگلدا كثابة الأمر gim‏ بصيغته العامة كما يلي! 


gim y #1 2 x3, family ( familyname) 
link (1inkname) 


exposure(expvar) eform voe(jackknife) 
exposure( ) «Jay Jl دالة‎ tink( ) uy بحدد لوع توزيع‎ famlly( ) حيث إن‎ 
مثل ذلك الذي نحتاج إليه في انحدار بواسون؛ والخهيار‎ pie” yall متفير‎ 
حيث إلها تفلهر على‎ ead يقوم بعرض مُغاملات الالحدار في شكل‎ eform 
تقدير الأخطاء المعيارية من خلال هسسابات‎ Ayy iB بدلاً من‎ exp) شكل‎ 
Jackknife calealations جاكليف‎ 
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وأنواع التوزيعات المحتملة هي؛ 
family(gaussian)‏ توزيع جاوس أو التوزيع الطبيعي (وهذا هو الوضع 
IT BL‏ 
family(igaussian)‏ معكوس توزيع جاوس. 
family(blnomial)‏ توزيع برنولي ذو الحدين. 
family(polsson)‏ توزيع بواسون. 
family(nbinomial)‏ التوزيع السالب ذو الحدين. 
family(gamma)‏ توزيع جاما. 
يمكندا أيضاً تحديد رقم أو متغبر يشير إلى u$‏ ذي حدين N‏ )3125 
المحاولات) أو رقم يشير إلى التباين السالب ذي حسدين ودوال الالحسرافء 
وذلك من خلال تحديدها في الخيار familye)‏ كما tuli‏ 
family(blnomial#)‏ . 


` family(binomlal varname) 
family(nblnomial #) 


دوال الربط المحتملة هي! 
DInk(Identity)‏ دالة الربط الموحدة (هذا هو الوضيع الافتراضي). 
Mink(log)‏ لو شاريتم. 
Hink(loglt)‏ الدالة اللو غاريثمية. 
Alla link(probit)‏ الاحتمال. 
Hink(eloglog)‏ دالة المتمم اللوغار يلمي . 
link(opower 4)‏ قوة الاحتمالالت. 
Hink(power d)‏ دالة Sill‏ 
link(nblnomial)‏ ذو الحدين السالب. 
Hiik(loglog)‏ لوغاريتم - لوغاربتم. 
_Unk(loge)‏ اللو غار.بتم Ho‏ 
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مُعامل التباين أو الأخطاء المعيارية يمكن تقديرها بعدة طرق» جزء من 
خيارات تقدير التباين gim‏ هي كما يلي: 
8 مقذر التباين ل هال Hall‏ وهال وهوسمان بي DA‏ 
التكعيبي «Hall and Hausman B-H-cubed‏ وبرندت -Berndt‏ 
oim‏ مقذر تباين مصفوفة المعلومات المشاهدة. 


oe 


-Huber/White مقدّر الشطيرة لتباين هوبر/وايت‎ robust 
مقدّر الشطيرة غير المتحيز للتباين.‎ 20 
مقدّر تباين الارتباط الذاتي الثابت واختلاف التباين.‎  nwest 
تقدير جاكنيف للتياين.‎ jackknife 
تقدير جاكنيف ذو الخطوة الواحدة للتباين.‎ jackknifel 


bootstrap‏ تقدير بوتستراب Bootstrap‏ للتباين» الوضع الافتراضي هو 


9 تكراراء ويمكن تحدید رقم تكرار معين عن طريق 
إضافة ذلك من خلال الخيار bstrep(#)‏ 


للحصول على قائمة كاملة بالخيارات مع بعض التفاصيل التقنية حولهاء 
قم بالبحث عن gim‏ في دليل المستخدم «Base Reference Manual‏ وللحصول 
على شرح أكثر تفصيلاً عن موضوعات GLM‏ يمكنك الاطلاع على دراسة 
Hardin and Hilbe‏ )2012(- 

الفصل (7) بدأ مع الانحدار البسيط لمتوسط العمر المتوقع على متوسط 
سنوات الدراسة في 188 دولة. 


.use C:\data\Nations2.dta, clear 
.regress life school 
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Source Number of obs - 188 
F( 1, 186) - 206.34 

Model 9846.65406 1 9846.65406 Prob » F = 0.0000 
Residual 8875.86926 186 47.7197272 R-squared = 0.5259 
Adj R-squared = 0.5234 

18722.5233 187 100.120446 Root MSE = 6.9079 

life Coef. Std. Err. t P»|t| [95$ Conf. Interval] 
school 2.45184 . 1706856 14.36 0.000 2.115112 2.788569 
_cons 50.35941 1.36924 36.78 0.000 47.65817 53.06065 





يمكننا إنشاء نفس النموذج والحصول على نفس التقديرات من DMa‏ 
استخدام الأمر .glm‏ 
-glm life school, link(identity) family (gaussian)‏ 


Iteration 0: log likelihood = -629.09751 


Generalized linear models No. of obs z 188 
Optimization + ML- Residual df z 186 
Scale parameter = 47.71973 
Deviance = 8875.869256 (1/df) Deviance = 47.71973 
Pearson = 8875.869256 (1/df) Pearson = 47.71973 
Variance function: V(u) = 1 [Gaussian] 
Link function : g(u) =u [Identity] 
AIC = 6.713803 


Log likelihood = -629.0975058 BIC - 7901.891 









OIM 
Coef. Std. Err. 2 P>|z| (95% Conf. Interval] 





life 





school 
-cons 


2.45184 .1706856 14.36 0.000 2.117303 2.786378 
50.35941 1.36924 36.78 0.000 47.67575 53.04307 


وحيث إن link(identity) *;L iM‏ و family(gaussian) Jea‏ هما . 
الخيارات الافتراضية» فيفكننا تركهما وعدم طباعتهما في الأمر أعلاه «elm‏ 
وسوف نحصل على نفس النتائج. 
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E‏ ا ا 


كما أله بالإمكان صياغة نفس اللموذج Sly OLS‏ نحصل على أخطاء 
معيارية byte‏ عن طريق بوتستراب, 
gin life school, link (identity)‏ 
family(gaussian) vce(bootstrap)‏ 


(running glm on estimation sample) 


Bootatrap replications (50) 


1 3 —— 4 سل‎ b 
EE EX! (rp qr ao p A Oe e EGRE ORC ا‎ SERRE E 50 
Qeneralised Lineer modela No, of oba . 188 
Optimisation ١ WU Reaidual df . 186 
. Scale paramatar © 47,71973 
Deviance = 60$78.969286 (1/d£) Deviance « 3 
Pearson © 76 (1/df) Pearson = 47,71073 
Varienge function: V(u) = 1 [Gaugnian] 
Link fungtion giu) =u (3dentity] 
ME s 6,713003 
Leg likelihood = -629.0975088 BIS "^ 1 
















Qbserved — Bootatrap Normal -basged 


life Coef. Std, lrr. a P» |s| [94€ Conf. Interval) 





echoo) 





2.48004 7 17.06 0,000 4.170223 4.733435 
90.138941 1.29713 38.02 0,000 47.01669 62.90213 









الأخطاء المعيارية لبوئستراب تعكس التباين المشاهد بين Malal‏ 
المقدرة من 50 عيلة تحتوي على 188 = Ale sn‏ تم الحصول عليها بطريقة 
المعاينة العشوائية مع استبدال البيانات الأصلية 188 = ”. في هذا المثال 
الأخطاء المعيارية لبوتستراب أقل من الأخطاء المعيارية النظرية ذات 
العلاقة ونتج عنها فترات ثقة أصغر. 

وبالمثل؛ فإنه يمكننا استخدام الأمر gim‏ لتكرار الالحدار اللوغاريتمي 
مع بيانات مكوك الفضاء الذي سبق لدا استخدامها في الفصل (9). في هذا 
المثال؛ قمنا بحساب الأخطاء المعيارية لجاكنيف ومعدل الاحتمالات أو 
عرض المُعَاملت في شكل أي (eform)‏ 
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„uga Ci\data\shuttled.dta, clear 
.gim any date, link(logit) family(bernoulli) 
eform vcea(jackknife) 


(running gim on estimation sample) 


dackknife replications (21) 


Generalised linear models No. of obs * 23 
Optimisation ! Mb Residual df . 21 
Scale parameter s 1 
Deviance a 28.90219209 (1/4£) Deviance = 47 
Pearbon s 3 (1/df) Pearson = 1,089531 
Vàrianàe fudcclon: Viluj = ue l1-u/1) {Binomial} 
tink fundedon 180) a 1ntu/l1-uj) ltogit) 
ME a 1,305874 
Leg likelihood = -12.99105634 MC a -39,86319 

















daehhnife 
sed. dre. 





Odda fatio P»|t| (99h Conf, Interval] 









1.003093 <7 1,33. 0.198 9980221 
1.346-08 — 1,89a-07 -1,88 4 2.320-21 


1.005374 


atone 76840.52 


العدار بواسون مع متهيراث ثنبؤية ثم التطرق إليه سابقاً فسي هسذا 
الفصل. ١‏ 


use CiNdataNoalridge.dta, clear 
poisson deaths i.rad age, nolog exposure (pyears) 


irr 
toltsl gim ee dyad وهو يتوافق مع‎ 
„gim deaths — . i,.rad age, link(1og) 
family(poisson) exposur&é(pysars) eform 
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ا د E rr RR ER‏ ا bau End EMEN HU‏ 


Iteration 0: log likelihood = -75.68551 
Iteration 1: log likelihood = -69.595462 
Iteration 2: log likelihood = -69.452909 
Iteration 3: log likelihood = -69.451814 
Iteration 4: log likelihood = -69.451814 
Generalized linear models No. of obs = 56 
Optimization : ML Residual df = 47 
Scale parameter = 1 
Deviance = 53.97836926 (1/d£) Deviance = 1.148476 
Pearson = 53.59824023 (1/df) Pearson = 1.140388 
Variance function: V(u) = u [Poisson] 
Link function : g(u) = 1n(u) [Log] 
AIC = 2.801851 
Log likelihood = -69.451814 BIC = -135.2132 



















OIM 


deaths IRR Std. Err. z P»|z]| [55% Conf. Interval] 





2 1.473591 .426898 .8351884 2.599975 

3 1.630688 .6659257 1.20 0.231 .732428 3.630587 

4 2.375967 1.088835 1.89 0.059 .9677429 5.833389 

5 .7278114 -7518256 -0.31 0.758 .0961019 5.511958 

6 1.168477 1.20691 0.15 0.880 .1543196 8.847472 

7 4.433727 3.337737 1.98 0.048 1.013862 19.38915 

8 3.89188 1.640978 3.22 0.001 1.703168 8.89326; 

age 1.961907 .1000652 13.21 0.000 1.775267 2.168169 

.cons .0000295 .0000106 -29.03 0.000 .0000146 .0000597 

in(pyears) 1 (exposure) 5 






بالرغم من أن الأمر ماع يكرر النماذج التي تم صياغتها بواسطة أوامر 
متخصصة: كما أضاف بعض القدرات الجديدة. هذه الأوامر المتخصصة لها 
ميزاتها التي منها السرعة وتوافر خيارات التخصيص. الميزة الأساسية للأمر 
gim‏ هي قدرته على التلاؤم مع نماذج ستاتا التي ليس لها أوامر خاصة بها. 


تحليل المكونات الرئيسية 
التليل الحاملي والنحليل العنقودي 


Principal Component, Factor 
And Cluster Analysis 





تحليل المكونات aus pI‏ والتحليل العاملي تعتبر طرق تبسيط وتوحيد 
العديد من المتغيرات المترابطة في عدد أصغر للأبعاد الضمنية. خلال 
خطوات التبسيط» يجب على المحلل الاختيار من بين عدد كبير من الخيارات 
الصعبة. وإذا كانت البيانات تعكس أبعادا ضمنية مختلفةء فإن الخيارات 
المختلفة قد تؤدي إلى..الحصول على نتائج متشابهة. وفي GLE‏ أبعاد ضمنية 
مختلفة» فإن الخيارات المختلفة قد تؤدي إلى الحصول على نتائج مختلفة. 
التحليل باستخدام هذه الخيارات يوضح كيف أن نتيجة معينة مستقرة أو إلى 
أي مدى تعتمد هذه النتيجة على خيارات عشوائية يتم اختيارها FL;‏ على 
الطريقة المستخدمة في التحليل. 

يقوم برنامج ستاتا بإجراء تحليل المكونات الرئيسة؛ والتحليل العاملي 
PEE‏ 3 خمسة أوامر رئيسة هي: 

Pea‏ تحليل المكونات الرئيسة. 
Factor‏ استخر اج عوامل وأنواع مختلفة متعددة تتضمن المكونات 


الرقيسة. 


- 


Screeplot‏ يقوم بإنشاء eu)‏ الحصى والحجارة (رسم بياني للجذر 
الكامن) من al‏ نتيجة للأمر pea‏ أو الأمر -factor‏ 
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pua neni‏ 


٥أ‏ يقوم بحساب الندوير المتعامد (عوامل غير مترابطة) أو 
التدوير المائل (عوامل مترابطة) بعد الأمر „factor‏ 


Prediet‏ يفوم بإنشاء درجات عوامل (متغيرات مركبة) وإحصائيات 
لحالات أخرى بعد الأمر factor‏ أو الأمر poa‏ أو الأمر 
‘rotate‏ 


درجات العوامل أو المتغيرات المركبة يتم إنشاؤها عن طريق الأمسر 
predict‏ ويمكن حفظها ورضعها في فوائم رتمثيلها بيانيا وتحليلها مثلها مئل 
متغيرات ستاتا الأخرى؛ سوف يتم توضيح مثل هذا التحليل في جزء جديد 
باستخدام مثال يتضمن بيانات دراسة استفصائية. 

المستخدمون الذين يقومون بإدشاء متغيرات مركبة باستخدام طرق 
معفدة؛ تقوم بإضافة متغيرات أخري معا بدون القيام بإجراء dial‏ عاملي 
يمكنهم من تقييم لتالجهم من خلال احتساب (Ul) a‏ معامل الثبات! 
الفا ثبات كرونباخ sa Cronbach‏ 

فبدلاً من دمج المتفيرات؛ فإن التحليل العنقودي بدمج المشاهدات؛ وذلك 
من خلال إيجاد عدم التداخل» وإلشاء مجمرعات J‏ تصنيفات علي TEM‏ 
عملي. طرق التحليل العنفودي أكثر Legh‏ من طرق التحليل العاملي. والأمر 
اا له عدة أدوات يمكنه من خلالها إجراء التحليل العلقوديء؛ وتمئيل 
النتائج cll‏ وإنشاء متغيرات جديدة لتحديد المجموعات التي ظهرت فسي 
النتائج. تحليل المكونات الرئيسة؛ والتحلبل العاملي؛ والتحليل العلقسودي؛ 
والأوامر المتعلقة بها تم توضيحها بالتفصيل في دليل الممستخدم الفاص 
ببر دامج ‘Multivariate Statistios Reference Manual WGs‏ 

يهم هذا الفصل موضوعه بإلقاء نظرة AD‏ علي قدرات لماذج المعادلة 
المركبة لبرنامج سانا om)‏ المستخدمة لقياس اللماذج التي تتضمن لياس 


mq‏ عرد 
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الطرق التي سوف يتم شرحها في هذا الفصل؛ يمكن الوصول Mil]‏ عبر 
فوائم ستانا التالية؛ 

Statistics > Multivariate analysis 

Graphics > Multivariate analysie graphs 

Statistics > SEM (structural equation modeling) 


Example Commands : yolqU عن‎ alin 


poa 31-0 


يفوم بحساب المكونات الرئيسة للمتغيرات التي تبدأ من المتغير xl‏ 


وحتى المتغير X20‏ ; 
poa x1-4540, mineigen(1)‏ 
يفوم بحساب المكونابٌ الرئيسة للمتغبرات التي تبدأ من المتغيسر 1× 
وحتى المتغبر 1220 ويقوم بحفظ المكونات التي تكون قيمة الجذر الكامن لها 


أكبر من [. 
factor x1-«40, ml factor(5)‏ 
يفوم بحساب التحليل العاملي بطريقة الأرجحية العظمى للمتغبرات مسن 
ابر gag‏ 2:؛ ويقوم daia‏ أرل خمسة عوامل فقط, 
92161 


يقوم بإلشاء رسم ببائي للحصيى والحجارة للجذر الكامن لعدد من 
المكرنات Lad‏ من آخر نتائج factor ya‏ 


rotate, varimax factorg(43) 
يفوم بحساب التدوبر المتعامد (أكبر تباين) لأول عاملين اثلين من أخر‎ 


نتائج للأمر factor‏ 
rotate, pxomax factors(3)‏ 
يفوم بحساب py yall‏ المائل (تدربر المحاور) لأول ثلاثة عوامل من آخر 
factor ja qui‏ 
‘predict £1 £2 £3‏ 


يفوم هذا الأمر بإدشاء ثلاثة متغبرات عاملية جديدة بأسم 1/ AA,‏ ,قار — $ 
على giu Al‏ للأمر rotate vr factor‏ 


alpha x1-x10 
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يقوم بحساب معدل الثبات » لكرونباخ لمتغير مركب ويُعرف al‏ 
مجموع المتغيرات من x1‏ إلى o0‏ وعند الإدخال سوف يتم عكس القيم 
السلبية. والخيارات التي تتعلق بهذا الأمر يمكنها تغيير هذا الوضع 
الافتراضيء أو إنشاء متغير تركيبي من خلال إضافة المتغيرات الأصلية أو 
قيمها المعيارية. 


.Cluster centroidlinkage x y z w, measure(L2) 
name (L2cent) 


يقوم هذا الأمر بحساب التحليل العنقودي التراكمي مع ارتباط لنقطة 
التقاطع باستخدام المتغيرات ‏ ,2 «x, y,‏ وتقوم مسافة إقليدس (L2)‏ بقياس 
الاختلاف بين المشاهدات. والنتائج من هذا التحليل العنقودي يتم حفظها باسم 
-L2cent‏ 


-cluster dendrogram, ylabel(0(.5)3) cutnumber(20) 
xlabel(, angle(vertical)) 


يقوم بإنشاء رسم بياني لشجرة التحليل العنقودي تعرض نتائج آخر أمر 
للتحليل العنقودي. الخيار cutnumber(20)‏ يحدد بأن الرسم البياني يبدأ مع 
ال 20 عنقوذا المتبقية بعد اضمحلال أغلب المشاهدات المتشابهة. وتتم 
طباعة توصيفات لهذا الشكل البياني في شكل عمودي أسفل الشكل نفسه. 

.Cluster generate ctype = groups(3), name(L2cent) 

يقوم بإنشاء متغير ctype aul as‏ (قيمه 1 أو 2 أو 3) تقوم بتصنيف 
كل مشاهدة في واحدة من أعلى ثلاث مجموعات تم إنشاؤها باستخدام التحليل 
العنقودي الذي توجد نتائجه في -L2cent‏ 
dile‏ المكونات الرئيسة والتحليل loll‏ للمكونات الرئيسة : 


Principal Component Analysis and Principal 
Component Factoring 


لتوضيح التحليل العامليء وتحليل المكونات الرئيسة» سوف نبدأ مع 
مجموعة بيانات صغيرة موجُودة بالملف planets.dta‏ تشر C‏ التسع كواكب 
التقليدية بالنظام الشمسي (هذه البيانات من دراسة Beatty et al.‏ 1981(« 
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البيانات تتضمن مجموعة من المتغيرات في شكل خام وشكل لوغاريتمي. 
وتم استخدام اللوغاريتمات هنا لتقليل cel YE‏ وجعل العلاقات أكثر agha‏ 


بين المتغيرات. 

.use C:\data\planets.dta, clear 
.describe 
Contains data from C:\data\planets.dta 

obs: 9 Solar system data 

vars: 12 2 Jul 2012 06:11 

size: 405 

storage display value 

variable name type format label variable label 
planet str? 595 Planet 
dsun fioat 59 و0.‎ Mean dist. sun, km*10^6 
radius float %9.0g Equatorial radius in km 
rings byte 58.09 ringlbl Has rings? 
moons byte $8.0g Number of known moons 
mass float %9.0g Mass in kilograms 
density float %9.0g Mean density, g/cm^3 
logdsun float %9.0g natural log dsun 
lograd float %9.0g natural log radius 
logmoons float %9.0g natural log (moons + 1) 
logmass float %9.0g natural log mass 
logdense float 59.09 natural log dense 





Sorted by:  dsun 
خطيا يشرح‎ Gs à هناك‎ gh تحليل المكونات الرئيسة توضح‎ gilts 


أعلى قيمة للتباين في المتغيرات التي تم مشاهداتها ويسمى 'مكون رئيس 
أول". كما أن النتائج أوضحت gh‏ هناك تركيبا خطيا متعامذا آخر (غير 


مترابط) يشرح أعلى قيمة تباين متبقية 'مكوّن رئيس ثاني" وهكذا حتى يتم . 


شرح كل قيم التباين. من المتغيرات + يمكننا استخراج المكونات الرئيسة ل 
k‏ والتي يمكنها شرح كل ad‏ التباين. تحليل المكونات الرئيسة يمكن استخدامه 
slats‏ لاختزال البيانات» GY‏ استخدام GL Se‏ + أقل سوف يشرح جز ءا كبيرًا 
من التباين» وإذا تم تركيز العمل بشكل أكبر على المكونات؛ فإنه بالإمكان 
تبسيط التحليل. 
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وعند تطبيق تحليل المكونات الرئيسة علسى سسئة متفبسرات توطسع 
الكواكب؛ فإندا دحصل على مكودات رئيسة تشرح التهاين بالكامل؛ 


.pea ringslogdsun-logdense 


Principal entponanta/rorriiation Number of obs 9 
Number of comp. = 6 

Trace - 6 

Rotation: lunrotatad e principai) fha 3 18 





حمست س س سے 


Proportion Cumulative 









Component Bigenvalue Difference 








1111149 11489 


Compa 4.16096 1.05064 0.1948 0.9654 
Comps 442323. 0839545 0.0187 0.9843 
Cenpé 0969747 0011041 0.0097 6.9939 
nips . 8 n. 1 1.0000 

00008404 ' 1.0000 





Peinedpal componente (@igenveecora) 








Variable Compl Comp? Comps Conpl Comps Comps | Unexplained 











logdense 


rings 0 
logdaun 0 
1618 6 
Lognodhs 0 
loads 0 
0 


نتائج الأمر pen‏ توضع لدا أن أول مكولين اثنين بشرهان أكشر مسن 
6 من التباين التراكمي للستة متغيرات بالكامل. القيم الكامدسة المتعافسة 
بالتباين المعياري ثم شرحها بواسطة كل مكون. مجموع ji‏ المعيساري 
للمتغيرات Aul‏ بالكامل هو 6. ومن هذا المجموع نرى أن المكسون الأول 
Comp!‏ يشر ح 4.62365 والذي نتم A3 Ja‏ مسع المسدد القلسي للمكؤانسات 
4.62365 + 6 = 0.7706 أو (i sa.‏ 9477 من المجمسوع الكلسي؛ المكسوان 
الثاني Compa‏ يشرح 1.16896 + 6 = 0.1948 أو حوالي %19 إطسالية؛ 
تحليل المكوئات له فيم كامنة Ui‏ من 1.0 وهذه الفيم تشرح أقل من ul.‏ 
تباين متغير واحد وهذا لا يساعدنا في اختزال البيائات. محللو البيانات في 
العادة يستبعدوز_المكو دات الثانوية؛ ويركزون على eia Ead‏ التي لها نسيم 
گامدة تساوي 1 gle‏ الأقل. 
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وأفضل طريفة لإجراء اخثزال للبيانات ثم من خلال الأمر factor‏ حيث 
يمكن استخدام العديد من الخيارات مع هذا الأمر؛ وهي تتعلق بتحليل التحليل 
العاملي للمكونات الرئيسة. وللحصول على عوامل المكودات الرئيسة لفسوم 
بطباعة الأمر الثالي: 


factor rings degdiua ~ logdense, pof 
(obs=9) 


Factor Analysis/cotrelation Number of obs e 9 
Method: prineipal-eomponent factors Retained factors e a 
Rotation! (unrotated) Number of params > 11 












Bigenvalue Difference Proportion Cumulative 





Factori 


4, 02305 3.45465 0.7706 0.7706 

à factor] 1.18556 1.080614 0.1948 0.0654 
Factors 0.11252 0.05355 0,0187 0.5041 

Paetotá 0.08837 0.00174 6.0007 0.9930 

Factors 0.03883 0.03651 8.0001 1.0000 


Factor’ 0.00006 i 0.0000 1.6000 


Lh testi independent v&. saturated: chid(18) = 100,49 Probsohia # 0,0000 


factor ldadings (patterh matrix) and uniqua variances 

















Uniquahens 


Factori — Faótubi 


Variable 


0,035) 





rings 0.9793 0.0773 
logdlun 0,6710 -0.7109 0.0441 
lograd 0.9229 — 0.3136 b.0086 
1oghoódns 0,9105 0,0003 0:0468 
logmasd 0,0331 0.5444 0.0003 
logáensa 0,0844 





0.4705 





التعليل العاملي للمكودات الرئيسة يبدأ باستخراج المكودات الرئيسة؛ P‏ 
الإبقاء على المكوئاث الثي تفي بمعيار الأهمية وهذا يتم الثراضياً؛ حيث يتم 
الإبفاء على تلك i gal‏ التي تكؤن قيمها الكامدة أكبر من 1. Cal ) Cas‏ 
سابقاً في مثال pen‏ أن أول مكولين فقط تقابل معيار الأهمية وهذان المكودان 
يشرهان أكثر من 9696 للتباين المشترك للستة مثفيرات معأًء وبذلك يمكلا 
إهمال بقية المكونات.وهي من المكون الثالث وحثى المكون السادس. 
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هناك خياران من خيارات الأمر factor‏ يمكنهما التحكم في عدد العوامل 
المستخرجة: 
Cus factors(?)‏ إن # تحدد عدد العوامل. 
mineigen(#)‏ حيث إن # تحدد Jf‏ قيمة كامنة للعوامل المحتفظ بها. 
وبما أن التحليل العاملي للمكونات الرئيسة يستبعد بشكل تلقائي العوامل 
التي تقل قيمها الكامنة عن 1. l‏ 
.factor ringslogdsun - logdense, pcf‏ 
وهذا مكافئ ja‏ : 
.factor rings logdsun - logdense, pcf mineigen(1)‏ 
في هذا call‏ يمكننا أن نحصل على نفس النتائج» وذلك من خلال 
طباعة الأمر: 
.factor rings logdsun - logdense, pcf factors(2)‏ 
ولعرض نافذة الرسم البياني (الرسم البياني للقيم الكامنة مقابل عدد 
العوامل أو عدد المكونات) بعد أي أمر factor‏ نقوم باس تخدام الأمر 
«screeplot‏ في الشكل )1.11( نرى Lad Dux‏ عند القيمة الكامنة = 1 صانعا 
القطع المعتاد للمكونات الرئيسة المحتفظ بهاء ومرة أخرىء فإن هذا القطع 
يؤكد عدم أهمية المكونات من 3 إلى 6. 
.8creeplot, yline(1)‏ 


Scree plot of eigenvalues after factor 


Eigenvalues 


Number 


الشكل )1.11( 
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Rotation : powl‏ 
التدوير يبسط أكثر تركيبة «bal gall‏ فبعد التحليل العاملي قم بطباعة 
الأمر rotate‏ ثم اتبع هذا الأمر بخيار يُحدد نوع التدوير. هناك نوعان 
شائعان للتدوير هما: 
×" التدوير المتعامد لأكبر تباين: منتجاً عوامل أو مكونات غير 
مترابطة (هذا هو الوضع الافتراضي). 
Promax()‏ التدوير المائل بروماكس وهذا النوع يسمح بوجود العوامل أو 
المكونات المترابطةء اختر عدد (قوة بروماكس) أقل من أو 
تساوي 4( وكلما زاد هذا العدد كلما كانت درجة الارتباط 
العاملي أقوى, والوضع الافتراضي ol‏ يكون promax(3)‏ 


وللحصول على قائمة.كاملة بطرق التدوير والخيارات الأخرى قم 
بطباعة الأمر chelp rotate‏ فعلى سبيل المثال: 
 factors()‏ هذا الخيار يحدد عدد العوامل التي يتم حفظها. 
entropy‏ لز الما الكل als‏ 


التدوير يمكن القيام به بعد أي تحليل عاملي وليس فقط مع التحليل 
العاملي للمكونات الرئيسة كما سنرى لاحقاء هذا الجزء سوف يستخدم الأمظة 
التي تم اسستخدامها مع الأمر factor‏ والأمر pef.‏ التدوير المتعامد 
(الافتراضي) لأول مكونين تم إيجادهما في بيانات المجموعة الشمسية؛ 

وللقيام بعملية التدوير قم بطباعة rotate‏ ۰ 
.rotate‏ 
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Factor analyeia/correlation Number of obs s 9 
Method: pringipal-component factors Retained factora s a 
Rotation: orthogonal variman (Kaiser off) Number of parama = 11 












Variance — Difference Proportion Cumulative 





Factor 





3.96900 u 0928 0,5615 0.5615 
$4010 0,4039 0.9654 


Vaccori 
Pactor? 








UR test; independant ve. saturated; chi2(19) = 100,49 Prob»chig = 0,0000 


Rotated factor loadings (pattern matrix) and unique variances 


Factor)  VFeatora 











Variable Uniqueneas 









tings 0.8478 0.3285 0.0383 
logdaun 0.1071 0,9711 0.0043 
lograd 0.9616 0.4880 0.0086 
Jogmoons 0.7794 0.5882 0.0465 
logmase 0.9936 0.0678 0.0083 
logdanse -0.3909 0.0644 









Factor rotation matrix 


| Factor) Factor? 









Factor) 
Feotora 


0.7980 
0.6086 -0.7980 





المثال أعلاه Ju‏ كل الأرضااع الافتراضية التدوير المتعامد لأعلي 
تباين؛ ونفس عدد العرامل يتم حفظها من آخر أمر 10:00 كما يمكلا 
الحصول على نفس giu!‏ بالضبط من خلال إضافة خبارات إلى الأوامر 
‘rotate, varimax factors(2)‏ 

ولإجراء تدربر بروماكس (promax)‏ المائل (يسمح بالعرامل المترابطة) 


oa‏ نتائج للتحليل العاملي نقوم بطباعة! 
‘rotate, promax E |‏ 
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Factor analyaia/correlatian Number of obs d 9 
Mached: principal: componant factors Retained factors = a 
Rotation: ohlique promax (Kaiser off) Number of parame = 11 


Variance Proportion Rotatad factors are correlated 
a hn ena re ain on i a ee 
4.12467 0.6874 
3,323170 0.8839 










Factor . 


Factor} 
Factor, 






LR teat: independent ve. saturated: ohig(i6) » 100.49 FProb»ghiad - 0 


Rotated factor loadings (pantern matrix) and unique variangea 











Uniqueneas 





Variable Factor} 









Vagpora 





0.7626. 





rings 









lagdaun -0.1747 1,0520 0.0403 
lagrad 0,9946 0.0060 0.0088 
logmoong 0.6907 0,4275 0,0468. 
logmasa 1.0883  -0.2154 0.0082 
logdenae | -0,1693 0.0844 






—— 


Faccor rotation matrix 







7830021 1 














088450 8 
0.3800 -0,6134 


Factor. 
Factora 


هذا المثال يستخدم بشكل التراضي قوة بروماكس .3( كما يمكنلا تحدبه 

قر بروماكس؛ وتحديد عدد العوامل بالضبط كما پلې: 
rotate, promax(3) factors (3)‏ 
علد استخدام promax(4)‏ فإن هذا سروف يسمح بإجراء Jsl apa‏ 
لمصفوفة التشبع؛ وهذا بودي إلي ارتباط x asl‏ بين العوامل Jil,‏ تفسيراً 

للتباين الكلي. 

وبعد إجراء تدوير بروماكس المائل؛ إن المتغبسرات rings, lograd,‏ 
Jognoons, logmass‏ سرف يكون الحمل أكثر Sus‏ على العامل الأرل؛ هذا 
پېدر أنه ذو 'حجم B‏ العديد من الأقمار “large sjze/many "Aye Quelli‏ 
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csatellites”‏ المتغير logdsum‏ و المتغير Ja logdense‏ أكثر على العامل 
الثاني مما يجعله 'بعيد/ أقل كثافة" «far out/low density"‏ كما أن pe‏ 
loadingplot‏ يقوم بإنشاء رسم بياني بعد إجراء التحليل العاملي» وهذا الرسم 
يساعد في تمثيل هذه النتائج برضوح (الشكل 2.11). 
.loadingplot, factors(2) yline(0) xline(0)‏ 


Factor loadings 








e 
e togmass 
logdense lograde 


rings e 


Factor 2 


logdsun 
e. 


~ 
Factor 1 


الشكل )2.11( 


Factor Scores : العاملية‎ awi 
القيم العاملية هي مكونات خطيّة يتم إنشاؤها بمعايرة كل متغير إلى‎ 
متوسط صفر› وتباين الوحدة ثم وزنها مع مُعاملات قيم العامل وجمعها لكل‎ 
يقوم بهذه الحسابات بشكل تلقائي مستخدما آخر نتائج‎ predict عامل. الأمر‎ 
يجيب أن‎ ii predict و عند استخدام الأمر‎ «factor أو الأمر‎ rotate للأمر‎ 


نقوم بإدراج أسماء المتغيرات الجديدة بعده وهذه الأسماء Sie‏ ارو J2‏ 
-predict f1 f2‏ 


4 
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(regression scoring assumed) 


Scoring coefficients (method - regression) 














Factorl Factor2 





Variable 


. 06605 


rings 0.21177 0 
logdsun 0.14513 -0.60818 

lograd 0.19960 0.31958 
logmoons 0.21119 0.00024 
logmass 0.18033 0.46591 
logdense 0.40252 





.label variable f1 "Large size/many satellites' 
.label variable F2 "Far out/low density 
.list planet f1 f2 


1. Mercury  -.9172388 -1.256881 
2 Venus -.5160229 -1.188757 
3. Earth ~.3939372 -1.035242 
4. Mars -.6799535 -.5970106 
5. Jupiter 1.342658 .3841085 
6. Saturn 1.184475 .9259058 
d Uranus .7682409 .9347457 
8. Neptune .647119 .8161058 
9. Pluto -1.43534 1.017025 





عند تحويل القيم إلى قيم معيارية» فإن القيم العاملية fl‏ و/رسوف يكون 
لها متوسطات (تقريبا) تساوي صفر› وانحراف معياري يساوي 1. 
.Summarize f1 f2‏ 





Variable Obs Mean Std. Dev. Min Max 
f1 9 -3.31e-09 1 -1.43534 1.342658 
f2 9 9.93e-09 1 -1.256881 1.017025 


ولذلك فإن القيم العاملية يتم قياسها بوحدات انحرافاتها المعيارية عن 
متوسطاتهاء فمثلاً في الجدول ما قبل السابق كوكب غطارد Mercury‏ له انحراف 
معياري قدره 0.92 تقريبا Ji‏ من esa laa ull‏ كبين/ acad‏ ”من Je‏ 
الصناعية" (#) GY‏ هذا الكوكب صغير وليست له أقمار صناعية؛ عُطارد له 
انحراف معياري أقل من المتوسط 'بعيد flag‏ أقل كثافة" )2( لأنه أقرب للشمس 
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per 


وذو كثافة عالية؛ وعلى العگس من ذلك فإن كو گب Saturn Je)‏ له الحر ILLE‏ 
معيارية 1.18 و 0,93 أعلى من المتوسط. لهذين البُعدين, 
تدوير بروماكس المائل يسمح بالترابط بين الفيم العاملية؛ 


.Correlate fi 2 
laha-8) 


۴1 ۴2 
f1 1,0000 
fa 0.4974 — 1,0000 


ll‏ العاملية للعامل 1 لها ارتباط موجب متوسط مسع القسيم العاملية 
للعامل 12 هذه الكواكب بعيدة US Ji y ap‏ هي كواكب من المعثمل أن 
تكون أكبر عجمأ مع العديد من الأقمار الصناعية. 

الأمر yal‏ الذي يتم استخدامه لإنشاء رسم بيالي بعد إجمراء عملية 
التعليل العاملي هو الأمر 601 حبٹ بلسوم برسمم شمكل الانششار 
لمشاهداث pylli‏ العاملية؛ كما يمكن استخدام هذا الأمر مع عوامل المكونسات 
الرئيسة؛ وتساعد هذا الأشكال في تحديد الفيم المتطرفة المتعددة أو التحليسل 
العدقودي للمشاهدات الئي تظهر مختلفة عن البلية؛ الشكل )3.11( بوضسح 
ثلاثة ألواع مختلفة من الكواكب. 
Scoreplot, mlábel(planet) yline(0) xiine(0)‏ 


Score variablas (factor) 
© واناظ‎ ١ 







© nin 
ete bhurn 





- A Jupie 
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الكراكب الصخربة الداخلية (مثل عطارد «Mercury‏ الخفاض في 'الحجم 
الكبير / العديد من الأقمار الصداعبة"' العامل 1« والخفاض كذلك في 'البعيد 
جدا/ مدخفصض الكثافة" العامل 2) تظهر معأ في الجادب الأسفل الأيسر في 
الشكل أعلاه؛ أما الكراكب العملاقة الغازية فلها خصائص عكسية تمامساًء 
وتظهر معا في الجانب الأعلى الأيمن» كوكب بلوتو Pluto‏ الذي يشبه شكله 
بعض الأقمار الخارجية المنتظمة فهذا الكركب فريد من لوعه مفاردة بالتسعة 
ألمار التفليدية؛ لأن بُعده 'بعيد جدا/ "MAS Uil‏ وفي نفس Sab ll‏ فهو ملخفض 
في بعد 'الحجم الأكبر/ العديد من الأقمار الصناعية"؛ لذلك فإن التحليل 
العاملي قام بتصليف كوكب بلوتو كنوع آخر من الأنواع التي لا تتداسب مع 
المجموعتين الرئيستين من الكواكب؛ وبالأخذ في الاعتبار الطبيعة الخاصة 
لكوكب بلوتو؛ فإن الاتحاد الفلكي العالمي قام في 2006 بإعادة تصليف 
كركب بلوتو من كونه aad‏ الكواكب الرئيسة إلى واحد من الكواكب التي 
تعرف باسم 'الكواكب الفزمبة' وهذا ad sy‏ ثمالي كواكب ففط, 
إذا قمدا باستخدام ندوبر أعلى تباین بدلا من تدوير بروماكس؛ فإن القيم 
العاملية غير المترابطة تكون! 
quietly factor rings logdsun - logdense, pof‏ 
quietly rotate‏ 


quietly predict varimaxi varimaxa 
Correlate varimaxl varimaua 


(obmuu9) 
varimaxi varimax2 
varimaxi 1.0000 
varimaxa 0,0000 1.0000 


علد إنشاء القيم العاملية باستخدام الأمر 4 فإن هذه الفيم )00( 
معاملتها مثل أي متغير من متغيرات ستاتا وإدراجها في أي أمرء وتحليل 
ارتباطها وتمثيلها بياديا وهكذاء القيم العاملية في العادة تستخدم في العلوم 
الاجتماعية والسلوكية وذلك لتوحيد الغديد من الاختبارات أو علاصر 
استمارات الاستبيان في متغيرات مركبة 3 مؤشرات؛ كما سيتم شرحه iay‏ 
في هذا الفصل. أما في مجال العلوم التطبيقية مثل علوم المناخ أو الاستشعار 


=li 5S الہ‎ Jul å heal بر‎ Ls لم‎ dyes: ii i-i aud ة‎ LU e aad (ali e qui N 
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الرئيسة بدون تدوير تساعد في تحليل حجم كبير من البيانات» في هذه 
التطبيقات فإن تحليل المكونات يُطلق عليه "الدوال المتعامدة التجريبية"٠ Ji‏ 
دالة متعامدة تجريبية - أو اختصارا EOFI‏ - تساوي قيمة عاملية لأول 
مكون رئيس غير مدورء 8072 هي قيمة المكون الرئيس الثاني وهكذا. 
التحليل العاملى الرئيس : Principal Factoring‏ 
الأمثلة أعلاه تضمنت تحليل المكونات الرئيسة وتم استخدام الأمر factor‏ 
مع الخيار Ll pef‏ الخيارات الأخرى factor OU‏ فتقوم بالتحليل العاملي 
بطرق مختلفة. 
pef‏ تحليل المكونات الرئيسة. 
pf‏ التحليل العاملي الرئيس (وهو الوضع الافتراضي). 
ipf‏ التحليل العاملي للمكونات مع قيم الشيوع المتكررة iterated‏ 
-communalities‏ 
ml‏ التحليل العاملي بطريقة الأرجحية العظمى. 
ارتباط معدلة» والتي فيها القطر الرئيس يتألف من تقديرات قيمة شيوع بدلا 
من 1« خيارات الأمر factor‏ وهي ipf s pf‏ تقوم بحساب التحليل العاملي 
الرئيس» وهي تختلف في كيفية تقدير قيم الشيوع: 
المتغيرات الأخرى. 
C uas ipf‏ التكرارية لقيم الشيوع. 
وتجدر الإشارة إلى أن تحليل المكونات الرئيسة يركز على شرح تباين 
المتغيرات» إلا أن التحليل العاملي الرئيس يشرح الارتباط بين المتغيرات؛ 
سوف نقوم بتطبيق التحليل العاملي الرئيس مع قيم الشيوع المتكررة (pf)‏ 
على البيانات الخاصة بالكواكب: 
-factor rings logdsun - logdense, ipf-‏ 
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(obs=9) 

Factor analysis/correlation Number of obs = 9 
Method: iterated principal factors Retained factors = 5 
Rotation: (unrotated) 3 Number of params - 15 


Beware: solution is a Heywood case 
(i.e., invalid or boundary values of uniqueness) 






Factor Eigenvalue Difference Proportion Cumulative 

















Factorl 4.59663 3 0 0. 
Factor2 1.12846 1.05107 0.1940 0.9843 
Factor3 0.07739 0.06438 0.0133 0.9976 
Factor4 0.01301 0.01176 0.0022 0.9998 
Factor5 0.00125 0.00137 0.0002 1.0000 
Factor6 -0.00012 T. 






LR test: independent vs. saturated: chi2(15) = 100.49 Prob»chi2 = 0.0000 


Factor loadings (pattern matrix) and unique variances 








Variable Factorl Factor2 Factor3 Factor4 Factor5 





rings 


logdsun 0.0966 

lograd -0.0004 
logmoons 0.0564 
logmass -0.0007 
logdense 






variable 










rings 


logdsun 0.0966 
lograd -0.0004 
Togmoons 0.0564 
logmass -0.0007 
logdense 





في الجدول أعلاه؛ برنامج ستاتا يعرض تحذير 'تحذير: الحل عبارة عن 
“Beware: solution is a Heywood case.” "35534 All.‏ و uc‏ النقر على الرابط 
Heywood case‏ في التحذير سوف يتم عرض شرح للمشكلة الموجودة في هذا 
call‏ وهذا يعكس صغر حجم العينة الاستثنائي (9 = )» وللتبسيط سوف 





Uniqueness 
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س ن ی ن IE‏ ی ی ل ne EU cm‏ 


لسثمر في التحليل؛ ولكن عند إجراء أي بحث؛ فإن مثل هذا اللسوع مسن 
التحذيرات يجب أن يعتبر تلبيها Ul‏ لإعادة النطر في الطريقة الثي نستخدمها. 


نرى أن هناك عاملين فقط لهما قيم كامدة أكشر مسن 1؛ باستخدام 
الخيارات pry pef‏ يمكئنا تجاهل العوامل البسيطة؛ وعند استخدام الخيار ipf‏ 
فإله يجب Lyle‏ تحديد كم عدد al yall‏ الثي لريد حفظها؛ ثم دكرر التحليل مع 
هذا العدد من العوامل؛ الآن سوف لثوم Jalas‏ عاملين اثنين! 
factor rings logdsun - logdense, ipf 286662)3(‏ 


(obase) 

Factor analysia/correlation Number of obs a j 
Method: iterated principal factors Retained factora » 4 
Rotation: (unretated) Numbar of params a 11 


Beware: solution is a Heywood case 
(4.0., invalid or boundary values of uniqueness) 











Eigenvalue Oifference Proportion — "umulative 











factor! 4.91499 انلك‎ 0.8061: 0, 8081 
Factor? 1.10083 — ^ 1.07631 0.1940 1,0000 
Factor] 0.02082 0.02013 0.0043 1,0043 
Factord 6.00409 0.009 0.0008 1,0081 
Factors -0.00354 0.02144 -0.0008 1,0008 
Factors -0.02937 i -0.0043 1,0000 


UR test: independent vs. saturated: chi2/18) a 100.49 Prob»chid s 0,0000 


Factor loadings (pattern matrix} and unique variances 


Factor] Factor? 






Variable Uniqueness 










rings 0.9747 0.0837 0,0470 
10048051 0.6833 -0.6731 0.1201 
lograd 0.918 0.3605 0.0084 
legmeens | 0.9889 -0,0220 0,0814 
legmas | 0.8430 — 0.5402 -5.00fs 


1500 -0.0294 


509 والتحليل العنقودي‎ plata! الحادي عشر ؛ تحليل المكوّئات الرليسة والتحليل‎ Jali 


بعد إجراء تحليل العوامل مع الخيار #زاء يمكننا إنشاء متغيرات مركبسة 
باستخدام الأمر rotate‏ والأمر prediet‏ بللس الطريقة الثي Ual‏ بها سسابقاً؛ 
وبسبب مشكلة Alla‏ هيوود Heywood-case‏ فإن القيم العاملية هنا Jil‏ لبولاً من 
نتائج pef‏ التي تحصلنا عليها سابفاًء وكاستراتيجية للبحث؛ فإنه مسن المفيسد 
تكرار التحليل العاملي باستخدام طرق مختلفة حثى لحصل على لشائج أكثسر 
A yi‏ ! 


اللحليل العاملى بطريقة الأرجحية العظمى 1 


Maximum-Likelihood Factoring 


التحليل العاملي بطريقة الأرجحية العظمى - يخئلف عن خيارات الأمر 
ind = factor‏ وسيلة لإجراء اختبار اث لفرضياتث: وهذه el JAN!‏ تساهد 
في تحديد عدد مناسب من. العوامل؛ وللحصول على عامل أرجحية عظطمى 
aal y‏ لبياناث الكواكب لفوم بطباعة الأمر الثالي؛ 


.factor rings logdsun - 1ogdense, mil 2 
factor(1) 





(obs=9) 

Factor analysis/correlation Number of obs a 9 
Method: maximum likelihood Retaited factors a 1 
Rotation: lunrobatàd) Numbar of params a 6 

Bchwars's BIC = 97,6244 
Log likelihood « -44,32054 (Akaika's) Arc) = 96.6411 





Eigenvalue 







Factor 





Difference Proportion Cumulative 








factori 4.417258 : 1.0000 1.0000 


LR teat: independent vs. saturated: chi2(15) = 100.49 Probschi2 = 0.0000 
LR testi 1 factor ve, saturated: dhi2(8) s $1.73 Probsehid = 0.0000 


Factor loadings (pattern matrix) and unique variances 











, Variable | factori Uniqueness 


rings 0,0254 
logdsun 0.6493 
lograd 0.1219 
logmoons 0.0805 
logmaas 0.2445 


logdense 0.4045 
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lae orla m a a 
لمعدل الاحتمال:‎ y^ تحتوي على اختبارين‎ ml مخرجات الخيار‎ 
الاستقلالية مقابل التشبع‎ SLR اختبار‎ 


وهو يختبر ما إذا كان نموذج ما بدون عامل (مستقل) يتناسب مع 
مصفوفة الارتباط المشاهدة بدرجة أسوأ بكثير من نموذج متشبع 
3 نموذج متناسب بشكل كامل» الاحتمال المنخفض (هنا 0.0000 
وهذا يعني 0.00005 (p<‏ يشير إلى أن نموذجا بدون عامل سوف 
يكون slag aa‏ 

اختبار LR‏ معامل 1 مقابل التشبع 


وهو يختبر ما إذا كان. نموذج العامل الواحد الحالي يتناسب بدرجة 
عامل واحد سوف يكون بسيطا جدا. 
بالطبع» Gd‏ نموذج عاملين سوف يكون أفضل: 


.factor rings logdsun - logdense, ml nolog 
factor(2) 


(0bs-9) 

Factor analysis/correlation Number of obs = 9 
Method: maximum likelihood Retained factors = 2 
Rotation: Cunrotated) Number of params = 11 

Schwarz's BIC = 36.6881 
Log likelihood = -6.259338 (Akaike's) AIC = 34.5187 


- 
Beware: solution is a Heywood case 
(i.e., invalid or boundary values of uniqueness) 










Factor 


Eigenvalue Difference Proportion Cumulative 













Factorl 
Factor2 


3.64200 
1.97085 





1.67115 


LR test: independent vs. saturated: chi2(15) = 100.49 Prob>chi2 = 0.0000 
LR test: 2 factors vs. saturated: chi2(4) = 6.72 Prob»chi2 - 0.1513 
(tests formally not valid because a Heywood case was encountered) 


Factor loadings (pattern matrix) and unique variances 


Factorl Factor2 
















Variable Uniqueness 


rings .8655 -0.4154 , 0.0783 

logdsun .2236 

lograd .0003 
logmoons 


سر 0850. 


logmass .0000 - 


logdense 


'Oooooo 
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الآن نحن وجدنا ما يلي: 
اختبار LR‏ الاستقلال مقابل التشبع 
أول اختبار لم يتغير» حيث إنه نموذج بدون عامل بسيط as‏ 
اختبار LR‏ عاملان مقابل التشبع 


نموذج عاملين ليس Uia‏ بدرجة كبيرة )0.1513 = (p‏ من نموذج 


يتناسب بشكل كامل. 
هذه الاختبارات ¢ تشير إلى Qo‏ عاملين اثنين يسمحان بإنشاء نموذج 


الطرق المتبعة في حساب التحليل العاملي بطريقة الأرجحية العظمى في 
العادة تؤدي إلى إيجاد حلول لمشكلة هيود أو إظهار نتائج غير واقعية مثل 
تباين سالب أو تفردية تساوي O‏ و LS)‏ في نموذج عاملين 
ml‏ في المثال أعلاه) فإن اختبارات ‏ تفتقر إلى مبررات Aa aly‏ وعند 
مشاهدة وصف لهذه.الاختبارات فإنه بالإمكان تحديد دليل واضح بخصوص 
العدد المناسب للعوامل. 


Cluster Analysis — 1: 1 — 39913) التحليل‎ 


التحليل العنقودي يشمل عدذا كبيرًا من الطرق التي تصنف المشاهدات 
في مجموعات أو ely asc‏ على الاختلافات في أعداد متغيراتهاء وفي 
أغلب الأحيان فإن التحليل العنقودي يستخدم مدخلا استكشافياً لتطوير تصنيف 
عملي بدلا من اختبار فرضيات محددة مسبقا. وفي الحقيقة ليست هناك 
نظرية واضحة تحدد اختبار الفرضيات في طرق التحليل العنقودي ASLAN‏ .. 
Ul‏ عدد الخيارات المتوافر في كل خطوة i‏ في التحليل يمكن وصفها بأنها 
GY Aiia‏ هذه الخطوات من الممكن أن تقو نذا qi uli‏ مختلفةء هذا الجزء 
يُعتبر نقطة بداية عن التحليل العنقودي. وسوف نتناول بعض الأفكار 
الأساسية ونشرحها باستخدام بنعض الأمثلة البسيطةء دليل المستخدم 
Multivariate Statistics Reference Manual‏ يوضح الخيارات الكاملة المتوافرة 
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في هذا الصبدد؛ كما أن دراسة Everitt of a,‏ )2001( تغطي هذه المراضيع 
بتفاصيل أكثر؛ وتتضمن مقارئات بين العديد من طرق التحليل العلقردي. 

كل طرق التحليل العنقردي تبدأ ببعض التعريفات عن أوجه اختلافها 
وتشابهها؛ فمقاييس الاختلافات تعكس المسافة بين مشاهدتين أر مجمرعة 
محددة من المتغيرات. وبصفة عامة مثل هذه المقاييس يتم تصميمها حتى لجد 
بان الاختلاف بين مشاهدتين مثمائلتين يساري ضفرا وألمنى LA!‏ 
للمشاهدات المختلفة يساوي ud‏ مقابيس التشابه فهي تعكس هذا الفياس؛ 
ولذا فإن المشاهدات المتمائلة لها تشابه يساري 1( خيارات الأمسر cluster‏ 
ببرنامج ستاتا تععليدا عدذا من الخيارات لفياس التشابه والاخئلاف. ولتسهبل 
عملية حساب ذلك؛ فإن برنامج ta‏ يقوم داخلباً بتحويل التشابه إلى اختلاف 
پم حسابه كما iul‏ 

الاختلاف = 1 - التشابه 


مقباس الاختلاف الافتراضي ببرنامج ستائا للربط المتوسط؛ والسربط 
الشامل؛ والربط المدفرد؛ والربط المتردد هو مسافة إقليدس التي يقرم بحسابها 
الخيار measure(L2)‏ فهذا الخيار يجسب المسافة بين المشاهدة / والمشاهدة J‏ 
كما igi‏ 

(5,647 x)*) ic 

حيث إن ,بد تمثل قيمة المتغير x,‏ للمشاهدة xy d‏ قيمة المتغير x,‏ للمشاهدة 
ر ؛ والمجموع يكون لكل متغيرات + التي تم إدخالها؛ الخيارات الأخرىي 
المتوافرة لفياس الاختلاف (dig)‏ بين المشاهدات التي تعتمد على المتفيرات 
المستمر d‏ تتضمن مسافة إقليدس التربيعية the squared Euclidean distance‏ 
L2squared)‏ هو الأمر الافتراضي للارتباط المركزي؛ والارتباط الوسيط 
وارتباط الأجزاء) ومسافة القيمة المطلقة (L1)‏ ومسافة أعلى قيمة (Linfinity)‏ 
وفياس تشابه معامل الارتباط, Ll c(eorrelation)‏ الخيارات المتوافرة للمتغيرات 
الثلائية تتضمن مو اءمة (matching) PIN‏ ومُعامل التشابه الثنائي لجاكارد 
Javeai Ji daevai d)‏ ومُعاملات ul ue ial‏ الخيار gower‏ يعمل مع متفيرات 
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ثنائية ومستمرة مختلفة. وللحصول على قائمة كاملة» وشرح مفصل عن 
خيارات قياس الاختلافات قم بطباعة .help measure option ja!‏ 

طرق التحليل العنقودي يمكن تصنيفها تحت فئتين هما: جزئي وهرميء 
الطرق الجزئية تقوم بتقسيم المشاهدات في أعداد Anda‏ مسبقا لمجموعات 
غير متداخلة» ولدينا طريقتان للقيام بذلك: 

متوسطات k‏ العنقودية :Cluster kmeans‏ التحليل العنقودي لمتوسطات 
Cus k‏ يقوم المستخدم بتحديد aac‏ العناقيد (K)‏ المراد إنشاؤهاء ثم يقوم ستاتا 
بعد ذلك بإيجاد هذه العناقيد من خلال إجراء بديلء ويقوم بتقييم المشاهدات 
التي تقع إلى أقرب متوسط. 

وسيط k‏ العنقودي :Cluster kmedians‏ التحليل العنقودي لقيم الوسيط ck‏ 
وهذا التحليل يشبه التحليل العنقودي لمتوسطات ck‏ ولكن هذا التحليل يتم 
باستخدام الوسيط. 

طرق التجزئة يبدو أنها أبسط وأسرع حسابياً من الطرق Auel‏ 
وضرورة تحديد عدد العناقيد boss dass‏ يُعتبر أحد عيوب العمل 
الاستكشافي. 


الكلوق: الوومية ن Raus‏ زي saca‏ عات المعو ا 
مجموعات أكبر بطريقة تدريجية. برنامج ستاتا يستخدم طريقة التكتل 
agglomerative‏ في التحليل العنقودي الهرمي وهذه الطريقة تبدأ معكل 
مشاهدة ويتم اعتبار كل مشاهدة كمجموعة منفصلة»ء أقرب مجموعتين يتم 
دمجهما وتستمر هذه العملية حتى التوقف في نقطة معينة أو حتى يتم وضع 
كل المشاهدات في مجموعة واحدة» ويتم عرض نتائج التحليل العنقودي 
الهرمي في شكل بياني شجري يسمى dendrogram‏ أو شكل شجري» هناك 
عدة خيارات متاحة لطرق ides jl‏ والتي تحدد ما الذي يجب أن تتم مقارنته 

Pas a على اکر‎ psi (ill عات‎ papal نين‎ 

الربط الفردي العنقودي :cluster singlelinkage‏ التحليل العنقودي للرابط 
ca jiadi‏ قوم os CUYD cibus,‏ زوج ye‏ المكناهدات الكل gob WS‏ 
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مجموعتين» وبالرغم من سهولة هذه الطريقةء فإن مقاومتها أقل للقيم 
المتطرفة أو أخطاء القياس. والمشاهدات تميل للانضمام للد للتحليل العنقودي 
مرة واحدة» وهذا يؤدي إلى إنشاء مجموعات طويلة أو غير im d j ja‏ 
مكونات هذه المجموعات غير متجانسة» ولكنها تربط مع بعضها بواسطة 
مشاهدات وسطية» وهذه المشكلة تسمى التسلسل. 

الربط المتوسط العنقودي cluster averagelinkage‏ التحليل العنقودي 
ania clas giall aj jl‏ هذا التحليل اليل cias all dau ial] AGE)‏ 
في مجموعتين مؤدياً إلى ظهور خصائص متوسطة بين الربط الكلي 
complete linkage‏ والربط المفرد «single linkage‏ دراسات المحاكاة وجدت 
ين ag sh‏ امرش يعمل يكل ae‏ فى aal‏ مق E‏ 1 1 
موثوق بدرجة معقولة (انظر دراسة Everitt et al.‏ 2001 والمصادر التي 
ذكرتها Rd i‏ امرجم V p‏ نوع من الربط يستخدم يشكلا كبر في 
علم الآثار. 

الربط الشامل العنقودي :cluster completelinkage‏ التحليل العنقو دي 
للربط الشامل» وهذا التحليل يستخدم زوج المشاهدات الأقل تشابها في 
مجموعتين» وهذا الربط أقل حساسية للقيم المتطرفة من الربط المفردء ولكنه 
في الاتجاه المعاكس نحو تجميع العديد من المشاهدات في عناقيد مدمجة 
مكانيا ومُحكمة. a‏ 

الربط المتردد العنقودي cluster waveragelinkage‏ التحليل العنقودي 
للربط المتردد الموزون. 

الربط الوسيط العنقودي :cluster medianlinkage‏ التحليل العنقودي 
dci‏ 

الربط المتوسط الموزون» والربط الوسيط هي تباينات في الربط 
المتوسط والربط المركزي على التوالي» وفي الحالتين فإن الاختلاف في 

كيفية التعامل مع مجموعتين مختلفتين في الحجم عند دمجهماء > ففي الربط 
Sas My cg 5S pal‏ اللمتوسظ 3e‏ العناصر لكل مجموعة تؤخذ في الاعتبار 
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عند الاحتساب معطيا في المقابل التأثير الأكبر للمجموعة الأكبر GY)‏ كل 
مشاهدة لها نفس الوزن)ء وفي الربط الوسيط والربط المتوسط الموزونء فإن 
المجموعتين يتم إعطاؤهما أوزانا متساوية بغض النظر عن كيفية وجود 
العديد من المشاهدات في كل مجموعة. الربط الوسيط يشبه الربط المركزيء 
حيث إن كلا الرابطين لهما فترات ثقة. 


الربط المركزي العنقودي :eluster centroidlinkage‏ التحليل العنقودي 
للربط المركزيء وهذا النوع من التحليل يدمج المجموعات ذات المتوسطات 
oc usd) aad‏ العتوشط ب ولذى يفكي Acus dabas‏ يتين 
عناصر (oie sana‏ هذه الطريقة لها نقاط فترات Cus Af‏ الدمج fay‏ عند 
مستوى أقل للاختلاف من الدمج السابق» الانعكاسات تشير إلى عدم استقرار 
ere E ds) oes‏ ووصعرية icu Loos, ea trcs‏ 
الأمر .cluster dendrogram‏ 


ربط الأجنحة العنقودية :eluster wardslinkage‏ التحليل العنقودي لرابط ' 
الأجنحةء حيث يقوم ayant‏ مجموعتين lee‏ تؤديان إلى أقل زيادة في خطأ 
مجموع «cles yall‏ ويتناسب هذا التحليل بشكل كبير مع المجموعات التي لها 
توزيع طبيعي متعدد المتغيرات»ء وذات أحجام متشابهة» ولا يتناسب هذا 
التحليل مع المجموعات التي تكون أعداد مشاهداتها في العناقيد أو 
الخو عات غير سساو 

سابقاً في هذا الفصلء رأينا أن التحليل العاملي للمكونات الرئيسة للبيانات 
الموجودة بالملف planets.dta‏ (الشكل 3.11( قام بتحديد ثلاثة أنواع من الكواكب: 
كواكب صخرية داخلية» كواكب عملاقة غازيةء وكوكب بلوتو في فئة خاصة به 
وحده؛ التحليل العنقودي يعتبر طريقة بديلة للسؤال عن نوع الكوكب» وحيث إن 
المتغيرات مثل عدد الأقمار (moons)‏ وتكتلها في الكيلوجرامات (mass)‏ يتم قياسه 
بوحدات قياس غير متشابهة مع اختلاف كبير fas‏ في التباين» لذلك يجب علينا 
إجزاء نوع من القياس المعياري بطريقة ما لتفادي الحصول. على نتائج متأثرة 
بالتباين الكبير لبعض العناصرء الخيار الأكثر le gut‏ للقيام بذلك - بالرغم من أنه 
ليس خيار! تلقائيا - هو وضع متوسط معياري يساوي صفرًا واستخدام وحدة 
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للانحراف المعياريء يمكن القيام بذلك عن طريق الأمر egen‏ (واس تخدام 
متغيرات في شكل لوغاريتمي لنفس الأسباب التي تم مناقشتها سابقاً)» الأمر 
summarize‏ يؤكد أن المتغيرات الجديدة z‏ لها متوسطات تساوي صفرا تقريباء 
وانحرافات معيارية تساوي واحد. 


.egen zrings - std(rings) 
.egen zlogdsun = std(logdsun) 
.egen zlograd = std(lograd) 
.egen zlogmoon = std(logmoons) 
.egen zlogmass = std(logmass) 
.egen zlogdens = std(logdense) 
.summ z* 





Mean Std. Dev. 










Variable 










zrings 9 -1.99e-08 1 -.8432741 1.054093 
zlogdsun 9 -1.16e-08 1 -1.393821 1.288216 
zlograd 9 -3.31e-09 1 -1.3471 1.372751 
zlogmoon 9 0 1 -1.207296 1.175849 
zlogmass 9 -4.14e-09 1 -1.74466 1.365167 












zlogdens 9 -1.32e-08 1 -1.453143 1.128901 


نتيجة التحليل العاملي للمكونات الرئيسة للأنواع الثلاشة هي نتيجة 
موثوقة» كما يمكن الحصول على نفس النتيجة من خلال التحليل العنقودي. 
فعلى سبيل call‏ يمكننا إجراء تحليل عنقودي هرمي مع متوسط الرابط 
باستخدام مسافة إقليدس Euclidean distance(L2)‏ كمقياس للاختلاف. الخيار 
name(L2age)‏ يعطي Laut‏ للنتائج التي نحصل عليها من هذا التحليل حتى 
يمكننا الإشارة إلى هذه النتائج في الأوامر اللاحقة» خاصية إعطاء أسماء 
للنتائج هي شيء مفيد عندما نحتاج إلى إجراء ase‏ من عمليات التحليل 
العنقودي ومقارنتها مع المخرجات. 


.Cluster averagelinkage zrings zlogdsun zlograd 
zlogmoon zlogmass 


zlogdens, measure(L2) name (L2avg) 
لم يحدث أي شيء بالرغم من أننا قد لاحظنا أن البيانات الآن تحتوي‎ 
«L2avg. على المتغير‎ S Us على ثلاثة متغيرات جديدة مع أسماء تم إنشاؤها‎ 
ليست مهمة بشكل مباشر ولكن يمكن‎ L2avg* هذه المتغيرات الجديدة‎ 
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استخدامها بشكل غير مباشر بواسطة الأمر cluster dendrogram‏ لرسم 
شجرة التحليل العنقودي أو الشكل الشجري الذي يعرض نتائج أحدث تحليل 
عنقودي هرمي (الشكل 4.11(« الخيار label(planet)‏ يؤدي إلى إظهار أسماء 
الكواكب (قيم المتغير (planer‏ كتوصيفات أسفل الرسم البياني. 
.cluster dendrogram, label (planet) ylabel(0(1)5)‏ 


Dendrogram for L2avg cluster analysis 


2 3 4 


L2 dissimilarity measure 


1 





o 
Mercury Venus Earth Mars Pluto Jupiter Saturn Uranus Neptune 


الشكل )4.11( 


الشكل الشجري )4.11( يعتبر أداة تفسيرية رئيسة للتحليل العنقودي 
NET‏ ورسك كم Perce Be‏ انين كن ماهو ومر BOT‏ 
العنقودية المتميزة - التي تظهر في أسفل الشكل - مع كل النتائج المدمجة 
في عنقود واحد في «Uie VI‏ كوكب Venus (ja già‏ وكوكب الأرض Earth‏ من 
ناحيف وكذلك LSS‏ أن انون Uranus‏ ورن Neptune‏ من ناعية ag pS)‏ 
الأقل اختلافاً أو أكثر الأزواج تشابهاًء حيث تم.تجميعها أولاً وكونوا أول 
عنقودين من مشاهدات متعددة في مستوى (الاختلاف) أقل من 1» LASS‏ 
Saturn da 55 Jupiter Ee‏ ثم Earth o‏ — فينوس Venus‏ والمريخ 
ai Mars‏ فينوس Venus‏ — الأرض Earth‏ — المريخ Mars‏ وعطارد Mercury‏ 
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وأخيرا المشتري Jupiter‏ زحل Satun‏ وأورانوس Uranus‏ - نیبتون 
Neptune‏ تم تجميعها في سلسلة سريعة وجميعها لها اختلافات أكثر من | 
بقليل» عند هذه النقطة لدينا نفس الثلاث مجموعات التي أظهرها تحليل 
المكونات الرئيسة في الشكل (3.11): الكواكب الصخرية الداخلية والكواكب 
العملاقة ps‏ وبلوتوء ADU‏ عناقيد تبقى مستقرة حتى الوصول إلى 
مستوى أعلى من الاختلاف (أعلى من 3) sigh‏ تم دمجه ضمن مجموعة 
الكواكب الصخرية الداخلية» وعند الوصول إلى درجة اختلاف أعلى من 4 
فسوف يندمج آخر عنقودين. 

إذن كم نوعاً من الكواكب لدينا؟ الشكل )4.11( يعطي الإجابة بوضوح 
وهي "الإجابة التي تعتمد على" كم درجة الاختلاف التي نريد القبول بها لكل 
نوع؟ الخطوط العمودية الطويلة بين مرحلة العناقيد الثلاثة ومرحلة العنقودين 
في أعلى جزء من الرسم البياني تشير إلى وجود ثلاثة أنواع يمكن التمييز 
بينها بوضوح.ء ويمكننا إنقاص هذه الأنواع الثلاثة إلى نوعين فقط وذلك بدمج 
مشاهدة (بلوتو (Pluto‏ لأنه مختلف عن البقية في مجموعته؛ ويمكننا التوسع 
ليكون لدينا خمسة أنواع فقط؛ وذلك من خلال توضيح الفرق بين عدد من 
الكواكب (ule)‏ سبيل «Stall‏ عطارد وفينوس Venus‏ — الأرض Earth‏ - 
المريخ (Mars‏ والتي لاتختلف كثيرا بحسب معايير المجموعة الشمسيةء ولذا 
فإن الشكل الشجري يدعم الشكل الذي يحتوي على ثلاثة أنواع. 

الأمر cluster generate‏ يقوم بإنشاء متغير جديد يشير إلى النوع أو 
المجموعة التي تنتمي إليها كل مشاهدة. في هذا group(3) Jali‏ يتطلب 
ثلاث مجموعاتء الخيار name(L2avg).‏ يقوم بتحديد نتائج معينة ونقوم 
بإعطائها اسم ج52. هذا الخيار هو أكثر الخيارات فائدة عندما تتضمن 
الحسابات تحليلا. عنقويا متعددا. 


-cluster generate plantype- groups (3), 
name (L2avg) i l 


-label variable plantype "Planet type' 
-list planet plantype p 
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planet plantype 


Mercury 
“Venus 
Earth 
Mars 


Wm fF WN در‎ 


Jupiter 


Saturn 
Uranus 
Neptune 
Pluto 


worn 0 





الكواكب الصخرية الداخلية تم ترميزها لتكون 1 = «plantype‏ والكواكب 
العملاقة الغازية 3 = «plantype‏ وكوكب igo‏ وحده 2 = plantype‏ ترميز 
المجموعات تكون 63 2ء 1 من اليسار إلى اليمين LS yo‏ بحيث تكون العناقيد 
النهائية في الشكل البياني الشجري (الشكل 4.11(« وعند القيام بحفظ البيانات 
فإن الرموز يمكن استخدامها كمتغير تصنيفي آخر في أي تحليلات لاحقة. 

بيانات الكواكب batel‏ طبيعي قوي وهذا هو السبب وراء حصولنا 
على Ap es‏ تكن Als Ds ios sisal‏ مكل لين ciego‏ 
الرئيسة» والتحليل العنقودي. يمكننا اختيار طرق أخرى لقياس الاختلاف 
وطرق ربط أخرى لهذا المثالء وسوف نصل إلى نفس النتيجة تقريباً. ومن 
ناحية أخرىء فإن البيانات النمطية الضعيفة أو المعقدة في العادة تظهر نتائج 
مختلفة oly‏ على طريقة التحليل المستخدمة. العناقيد التي تنتج من طريقة 
تحليل واحدة قد لا تكون دليلا على إمكانية تكرار نفس النتائج مع طرق 
أخرى أو مع قرارات تحليلية مختلفة قليلا. 
التحليل العنفود2 — 2 : 2 — Cluster Analysis‏ 

اكتشاف تصنيف موثوق وبسيط لتوصيف الكواكب التسعة كان واضحاًء 
ولعزض أمثلة أكثر صعوبةء فإننا سوف نستخدام بيانات الدول الموجودة 
بالملف «Nations2.dta‏ متغيرات التنمية البشرية للأمم المتحدة يمكن تطويرها 
لتكون تصنيفاً عملياً للدول. 


.use C:\data\Nations2.dta, clear 
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.describe 
Contains data from C:\data\Nations2.dta 
obs: 194 UN Human Development Indicators 
Vars: 13 2 Jul 2012 06:11 
size: 12,804 
storage display value 
variable name type format label variable label 
country str21 5 Country 
region byte %8.0g region Region 
gdp float %9.0g Gross domestic product per cap 2005$, 2006/2009 
school float $9.0g Mean years schooling (adults) 2005/2010 
adfert float $8.0g Adolescent fertility: births/1000 fem 15-19, 
2010 
chldmort float %9.0g Prob dying before age 5/1000 live births 
2005/2009 
life float $9.0g Life expectancy at birth 2005/2010 
pop float $9.0g Population 2005/2010 
urban float $9.0g Percent population urban 2005/2010 
femlab float $9.0g Female/male ratio in labor force 2005/2009 
literacy float %9.0g Adult literacy rate 2005/2009 
co2 float %9.0g Tons of C02 emitted per cap 2005/2006 
gini float %9.0g Gini coef income inequality 2005/2009 





Sorted by: region country 


بالعمل مع نفس البيانات في الفصل )7( رأينا تحويلات غير خطيّة مثل 
اللوغاريتمات التي ساعدت في جعل التوزيعات أكثر طبيعية وجعل العلاقات 
خطيّة أكثر بين بعض المتغيرات» نفس الطرق للتحويلات غير الخطية يمكن 
تطبيقها فى التحليل العنقودي» ولكن لجعل المثال أكثر بساطة فلن نقوم 
باستخدام iu‏ الطرق هنا. التحويلات الخطية التي تجعل المتغيرات أكثر 
معيارية مازالت ضرورية هناء وإذا لم نقم بذلك فإن المتغير gdp‏ والذي 
يتراوح من حوالي 280 دولارًا إلى 74,906 دولارات (بانحراف معياري 
2 دولارًا) فإن ذلك قد يؤدي إلى التغلب على المتغيرات الأخرى مثل 
Tif‏ والذي يتراوح بين 46 تقريباً إلى 83 سنة (بانحراف معياري 10 
سنوات). في الجزء السابق قمنا بتحويل بيانات الكواكب لتكون بيانات 
معيارية من خلال طرح مئوسط كل متغير ثم قسمته على انحرافه المعياري 
حتى تكون كل نتائج z‏ لها انحرافات معيارية تساوي 1. في هذا الجزء سوف 
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نقوم باتباع طريقة مختلفة تسمى مدى المعايرة» والتي تعمل بشكل جيد مع 
التحليل العنقودي. 

مدي المعايرة يتضمن قسمة كل متغير على مداه» ليس هناك أمر 
ببرنامج ستاتا يقوم بذلك بطريقة مباشرة ولكن يمكننا إنشاء أمر للقيام «dll‏ 
وللقيام بذلك cà gn‏ نستخدم النتائج التي قام برنامج ستاتا بحفظها في ذاكرته 
العاملة بعد الأمر summarize‏ وذلك بطباعة الأمر «return list‏ (بعد عمليات 





أوامر النماذج مثل regress‏ أو factor‏ وبدلا من ذلك قم باس تخدام gyl‏ 
.(ereturn list‏ في هذا المثال سوف نلقي نظرة على النتائج المخزنة بعد 
الأمر summarize pop‏ ثم استخدام أعلى وأقل ad‏ (المخزنة كأعداد قياسية 
والتي يسميها برنامج ستاتا («هم): 5 (rmin)‏ لحساب نسخة جديدة لمدى 
المعايرة للمجتمع. 
.Summarize gdp‏ 
Variable Obs Mean Std. Dev. Min Max‏ 


gdp 179 12118.74 13942.34 _. 279.8 74906 


.return list 


Scalars: 
r(N) = 179 
r(sum_w) = 179 
r(mean) = 12118.73919336756 
r(Var) = 194388878.6050418 
risd) = 13942.34121677711 
r(min) - 279.7999877929688 
r(max) = 74906 
r(sum) = 2169254.315612793 


-generate rgdp = gdp/(r(max) - r(min)) 
-label variable rgdp "Range-standardized GDP" 


يمكن استخدام أوامر مشابهة أخرى لإنشاء نسخ من مدى المعايرة 
.quietly summ school‏ 
generate rschool = school/(r(max) - r(min))‏ 


.label variable  rschool  "Range-standardized 
schooling’ : 
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-quietly summ adfert 

.generate radfert - adfert/(r(max) - r(min)) 
.label variable  radfert "Range-standardized 
adolescent fertility 


وهكذا معرفا المتغيرات 8 الجديدة والتي تظهر بالقائمة أدناه. 
.describe rgdp-rfemlab‏ 





storage display value 
variable name type format label variable label 
rgdp float $9.0g Range-standardized GDP 
rschool float $9.0g Range-standardized schooling 
radfert float $9.0g Range-standardized adolescent fertility 
rfemlab float $9.0g Range-standardized female labor 
rchldmort float $9.0g Range-standardized child mortality 
rlife float $9.0g Range-standardized life expectancy 
rpop float %9.0g Range-standardized population 
rurban float 59.09 Range-standardized percent urban 


إذا لم تكن أوامر 6 التي تم استخدامها سابقا صحيحةء فإن مدى 
متغيرات مدى المعايرة الجديدة يجب أن يساوي l‏ الأمر 2S 5 tabstat‏ ذلك. 
.tabstat rgdp - rfemlab, statistics (range)‏ 


stats 






rgdp  rschool  radfert ` rfemlab rchldm-t rlife rpop rurban 





1 .9999999 





1 





.9999997 


عند تحويل المتغيرات التي تهمنا إلى الصيغة المعيارية يمكننا إجراء 
التحليل العنقودي» وعند قيامنا بتصنيف ASÍ‏ من 100 دولة إلى عدة أنواع 
فإنه ليس لدينا أي سبب لافتراض أن كل نوع سوف يتضمن نفس عدد 
الدول» الرابط المتوسط (الذي تم استخدامه مع بيانات الكواكب) مع Vay‏ 
الطرق الأخرى يعطي كل مشاهدة نفس الوزن» هذا يجعل العناقيد أكبر 
وأكثر Ish‏ أثناء عمليات التجميع. ومن ناحية أخرىء» فإن طرق المتوسط 
الموزون والرابط المتوسط تعطي وزناً متساوياً لكل عنقود بغض النظر عن 
عدد المشاهدات التى يحتويها. وبالتالي فإن مثل هذه الطرق تعمل بشكل جيد 
للكشف عن العناقيد غير متساوية الحجم» الرابط الوسيط يشبه الرابط 
المركزي حيث Ad‏ عرضة للانعكاسات (والتي سوف تحدث مع هذه البيانات) 
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لذلك فإن المثال التالي يقوم بتطبيق الربط المتوسط الموزونء كما أن مسافة 
القيمة المطلقة (measure(L1))‏ تعتبر طريقة لقياس الاختلاف. 


.cluster waveragelinkage rgdp - rfemlab, 
measure(L1) name(Liwav) 


التحليل العنقودي الكامل يقوم بإنتاج شكل شجري كبير جدا: 


.Cluster dendrogram 
too many leaves; consider using the cutvalue() 
or cutnumber() options r(198): 


بعد ظهور رسالة الخطأ أعلاهء فإن الشكل )5.11( يقوم باستخدام الخيار 
cutnumber(100)‏ لإنشاء شكل شجري يبدأ مع 0 مجموعة بعد فترة 
بسيطة من بداية أول عمليات الدمج. 


.Cluster dendrogram, ylabel(0(.5)3) 
cutnumber (100) 


Dendrogram for L1wav cluster analysis 


2 2.5 


L1 dissimilarity measure 
1.5 


1 





الشكل )5.11( 


Y‏ يمكن قراءة التوصيفات الموجودة أسفل الشكل )5.11( ولكن يمكننا 
تتبع الاتجاه العام للتحليل العنقودي. أغلب عمليات الدمج تمت عند اختلافات 
أقل من 1. هنأك دولتان فقط في مركز الشكل الشجري وهذا غير معتاد. هاتان 
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Ae gles Cali cjl pal‏ الذمخ بح da ya‏ اختلاف dar i 2 og glad‏ حيست إن 
هاتين الدولتين المستقرتين تختلفان عن كل الدول الأخرىء هذا واحد من أربعة 
عناقيد باقية في مستوى الاختلاف الأعلى من 62 الأول.والرابع من هذه 
العناقيد الأربعة (اقرأ من اليسار إلى اليمين) تظهر غير متجانسة وتم إنشاؤها 
من خلال عمليات دمج متتالية لعدد من المجموعات الفرعية الرئيسة الواضحة. 
وعلى خلاف ذلك فإن العنقود الثاني يظهر أكثر تجانساء حيث إنه يجمع بين 
العديد من الدول التي تم دمجها في مجموعتين فرعيتين لهما اختلاف أقل من 1 
ثم دمجهما في مجموعة واحدة عند مستوى اختلاف أعلى من 1 بقليل. 

الشكل )6.11( يعرض وضعية أخرى لهذا التحليلء وهذه المرة 
باستخدام الخيار cutvalue(1.2)‏ لعرض العناقيد فقط التي يكون اختلافها أعلى 
من 1.2 بعد القيام بأغلب عمليات الدمج» الخيار showcount‏ يقوم بتحويل 
التوصيفات أسفل الشكل البياني (n713, 5-11, etc.)‏ وهي تشير إلى عدد الدول 
في كل مجموعةء حيث إننا نرى أن المجموعات 8 9( 12 تحتوي US‏ منها 
على دولة واحدة فقط. 


-cluster dendrogram, ylabel(0 (.5)3) 
cutvalue(1.2) showcount 


Dendrogram for L1wav cluster analysis 


2.5 


2 


1 


L1 dissimilarity measure 
1.5 


e 
G1 G2 G3 G4 G5 G6 G7 G8 G9 G10 G11 G12 04 G15 
052136-11 n=3 n=6 n-45n-15n-33 n-1 n=1 n=15 n=4 n=1 pe ged n=10 


الشكل )6.11( 
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الشكل )6.11( يوضح Gb‏ هناك 15 مجموعة باقية عند درجة اختلاف 
أعلى من 61.2 للتوضيح فقط سوف نأخذ في الاعتبار أعلى أربع مجموعات 

فقط والتي لها درجة اختلاف أعلى من 2ء الأمنر cluster generate‏ يقوم 
il Lc cQ cm aei.‏ العنقودي 
ونقوم بتسميته LIway‏ 


.Cluster generate ctype = groups(4), 
name(Liwav) 
.label variable ctype "Country type' 


وسوف نقوم في الخطوة التالية باختبار ماهي الدول التي تعود لكل 
مجموعة وذلك من خلال طباعة الأمر: 


.sort ctype 
.by ctype: list country 


القائمة الطويلة الناتجة من الأمر أعلاه - لم يتم عرضها هنا - توضح 
بأن هناك عنقودًا به دولتان لاحظنا وجودهما في الشكل )5.11( من النوع 3 
وهما الهند والصينء والعنقود الثاني المتجانس تسيا في الشكل (5.11) 
والذي يُصنف كنوع 4 يتضمن مجموعة كبيرة من أفقر الدول وأغلبها دول 
أفريقية» النوع 2 وهو متنوع نسبيا يحتوي على الدول الأكثر ثراءً؛ء وهي 
تتضمن الولايات المتحدة واليابان والعديد من الدول الأوروبية»ء النوع 1 
متنوع Lad‏ يتضمن الدول التي بها مستويات معيشة متوسطة؛ ويظل السؤال 
الموضوعي هو ما إذا كانت هذه الأنواع ذات معنى» وهذا السؤال ليس 
إحصائياء والإجابة تعتمد على الاستخدامات. وما هي التصنيفات التي نحتاج 
إليهاء الاختيار بين مجموعة مختلفة من الخيارات في خطوات التحليل 
العنقودي سوف يؤدي إلى الحصول على نتائج مختلفة» وبإجراء التحليل مع 
مجموعة متعددة من الخيارات سوف نتعرف على أكثر النتائج استقرارا. 
استخدام الدرجان العاملية ي Jus W‏ : 


Using Factor Scores in Regression 





تحليل المكونات الرئيسة» والتحليل العاملي في العادة يساعدان على 
تعريف المتغيرات المركبة الجديدة لإجراء عمليات تحليل أكشرء فمثلا 
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cie pes بالأمر أن‎ hana يتم‎ ls العاملية‎ uc 
re 1.dta جودة بالملف‎ M الاننتقضناء‎ ET نستخدم‎ 


.uge C:\data\PNWsurvey2_11.dta, clear 
.describe 


Contains data from C:\data\PNWsurvey2_11.dta 








obs: 734 Pacific NW CERA survey (February 2011) 
Vars: 16 2 Jul 2012 06:11 

size: 13,946 

storage display value 

variable name type format ' label variable label 
CHEM ا ج‎ c Ld 
age byte %8.0g age Age in years 
sex byte — $8.0g sex Gender 
educ byte %14.0g degree Highest degree completed 
party byte 511.09 party Political party identification 
newcomer byte — $9.0g yesno Moved here within past 5 years 
surveywt float %9.0g CERA survey wt--adults/age/race/sex/county 
forest byte  313.0g eff Loss of forestry jobs or income 
cutting byte — $13.0g eff Overharvesting or heavy cutting of timber 
losfish byte %13.0g eff Loss of fishing jobs or income 
overfish byte %13.0g eff Overfishing in the ocean 
water] byte  $13.0g eff Water quality or pollution issues 
water2 byte  $13.0g eff Water supply problems 
warming byte %13.0g eff . Global warming or climate change 
sprawl byte %13.0g eff Urban sprawl/development of countryside 
weather byte %13.0g eff Unusual/extreme weather-related events 
losscen byte $13. 0g eff Loss of scenic natural beauty 
Sorted by: 


المتغيرات 16 في هذه البيانات تمثل بيانات من استقصاء هاتفي للسكان 
في منطقة ساحلية بشمال غرب المحيط الهادئ. هذا الاستقصاء والذي تم 
إجراؤه في فبراير 11 يعتبر le‏ من مبادرة تتضمن سلسلة استقصاءات 
ثم القيام بها تحت إشراف منظمة المجتمع والبيئة في المناطق الريفية 
الأمريكية ية والتي تعرف Jl) (CERA) aul | PER‏ در اسة Hamilton et al.‏ 
-(2010b; Safford and Hamilton 2010‏ 

في هذا المثالء هناك عشرة أسئلة تبدأ من forest‏ وحتى losscen‏ 
تستفسر GUIS Lec‏ قضايا بيئية معينة لها تأثيرات محلية. الأسئلة كانت 


كما يلي: 
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سوف أقوم بقراءة قائمة من القضايا البيئية التي قد تكون مشاكل في 
المناطق الريفية» أما بشأن المكان الذي تعيش فيه فأنا أود أن أعرف ما اذا 
كنت تعتقد أن هذه القضايا ليس لها تأثير أو تأثيرات بسبطة أو تأثيرات 
جوهرية على أسرتك أو المجتمع الذي تعيش فيه خلال فترة:ال 5 سنوات 
الماضية؟ 
خسارة وظائف بالغابات أو دخل من الغايات؟ 


الإفراط أو التبذير في قط ع أخشاب البناء؟ 


خسارة وظائف صيد الأسماك أو دخل صيد الأسماك؟ 


الصيد الجائر في المحيط؟ 

جودة الماء وقضايا التلوث؟ 

مشاكل في /مدادات المياه؟ 

الاحتباس الحرارني أو التغير المناخي؟ 

الزحف العمراني أو التطور السريع في المناطق الريفية؟ 
الأحداث غير العادية أو البالغة المتعلقة بالطقس؟ 


خسارة الجمال الطبيعي الخلاب؟ 
لكل سؤال يمكن للمشارك في الدراسة أن يقول ما إذا كانت هذه القضايا 
ليس لها تأثير أو تأثيرات بسيطة أو تأثيرات جوهرية على أسرهم أو مجتمعهم. 


.Svy: tab forest 


(running tabulate on estimation sample) 


Number of strata = 1 
Number of PSUs = 


734 






Loss of 
forestry 
jobs or 


income proportions 





Key: proportions = cell proportions 


Number of obs 
Population size 
Design df 


734 
725.97798 
733 
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(obs=734) 


Factor analysis/correlation 
Method: iterated principal factors 
Rotation: (unrotated) 


Number of obs 


Retained factors 
Number of params 


f 


734 





Factor 


Eigenvalue 





Factorl 
Factor2 
Factor3 
Factor4 





Factor5 
Factor6 
Factor? 
Factors 
Factor9 
FactorlO 


LR test: independent vs. saturated: 


Factor loadings (pattern matrix) and unique variances 





Variable 


Factorl 














.16440 
.38201 
.31834 
.22413 
.16083 
.04494 
.03554 
.00732 
.00025 


سس نر هت تت © 9 هت سا 


' 
e 


Factor2 





دمو ا تهت تت وات ooo‏ 


Factor3 


Difference 


- 78239 
.06367 
.09420 
.06330 
.11590 
.00940 
.02822 
.00757 


chi2(45) 












forest 
cutting 
losfish 
overfish 
waterl 
water2 
warming 
Sprawl 
weather 
losscen 


Variable 


forest 
cutting 
losfish 
overfish 
waterl 
water2 
warming 
sprawl 
weather 
losscen 





Ooo000005500000 


.0347 
.0223 -0.0035 
.0585 -0.0069 
.0818 0.0049 
. 0083 0.0041 
.0078 -0.0146 
.1150 0.0029 
.0163 0.0625 
.1005 0.0029 
.0017 -0.0554 


0.0045 














Factor4 











.3357 
.0126 
.0834 
.3887 
.0438 
.1051 
.0950 
.1117 
0.0485 
.1033 





ooo © 2 هه ه هه‎ O 


Proportion 


1 
e 


O O OOOO © O oO 


.2049 
.0672 
.0560 
.0394 
.0283 
.0079 
.0063 
.0013 
.0000 











Cumulative 








FP—-ooccocoocooono 


.7936 
.B608 
.9168 
.9563 
.9846 
.9925 
.9988 
.0000 
.0000 








= 2030.48 Prob>chi2 = 0.0000 


Factor5 


-0.0288 
-0.3822 

0.2061 
-0.0030 
-0.0795 
0.0989 
0.0374 
0.0683 
0.1012 
0.0483 








.3809 





Factor6 


.0285 
.0466 
.0068 
.0670 
.2092 
.0258 
.1280 
.1921 
.1310 
.1960 





Factor? 





.0608 
.0004 
.0727 
.0416 
.1172 
.1055 
.0772 
.0294 
.0129 
.0486 











530 الإحصاء مع برنامج ستاتا 
كم axe‏ العوامل التي يجب علينا حفظها؟ أول اثنين فقط قيمة الجذر 
الكامن لها أعلى من 1 بالرغم من أنها مع التحليل العاملي الأساسي (لا 
يتشابه مع تحليل المكونات الرئيسة) قطع قيمة الجذر الكامن لها - 1 في 
بعض الأحيان يُعتبر دقيقة las‏ الرسم البياني للحصى والحجارة (الشكل 
8.11( يؤكد Lily‏ أنه بعد أول عاملين هناك قيمة جذر كامن منخفضة مع 
ثبات باقي العوامل الأخرى. 


-screeplot 


Scree plot of eigenvalues after factor 


wt 
e 
ua 
o 
3 
Sey 
9 
e 
iw 
eo 
1 س‎ a a 
0 2 4 6 8 10 
Number 
(8.11) الشكل‎ 


بعد تجارب أكثر مع العاملين الاثنين المحتفظ بهما والمدوّرة سوف تكون 
هناك ثلاثة عوامل أو أكثر (لم يتم عرضها هنا) كما يبدو أن العاملين الاثنين 
لهما نتائج أفضل وقابلة للتفسير» وهذا شيء مهم يجب أخذه في الاعتبار»ء 
عندما نقرر الاستمرار مع العاملين» فإن أول خطوة (لأننا نستخدم التحليل 
العاملي الرئيس التكراري)'تتضمن تكرار التحليل مع الاقتصار على عاملين 
-factor(2)‏ 3 


الفصل الحادي عشر : تحليل المكونات الرئيسة والتحليل العَامِلي والتحليل العنقودي ]53 





.factor forest cutting losfish overfish waterl 
ipf 


water2 warming 
factor(2) 
(obs=734) 


sprawl 


Factor analysis/correlacion 
Method: iterated principal factors 


Rotation: (unrotated) 


weather 


Number of obs 
Retained factors 
Number of params 


losscen, 








Factor 


Factorl 
Factor2 
Factor3 
Factor4 
Factor5 
Factor6 
Factor? 
Factor8 
Factor9 
Factor10 


LR test: independent vs.” saturated: 


Factor loadings 






Variable 


forest 
cutting 
losfish 
overfish 
waterl 
water2 
warming 
sprawl 
weather 
losscen 


المحاور بروماكس Promax‏ (منحرف) يبط الأنماط 


Eigenvalue 


.06650 
.21021 
12357 
.09209 
.03149 
.05357 
.10991 
.11817 




















هه 0ه هه © © 5 © © © 


ooo © د تت‎ 0: 5 OW” 





Difference 


.85629 
.08664 
.03148 
.06060 
.08506 
.05634 
.00827 
.05758 


chi2(45) 


Proportion 









.2496 
.0492 
.0289 
.0215 
.0074 
.0125 
.0257 
.0277 


(pattern matrix) and unique variances 


Factorl Factor2 

















ات مم فو فم يو مو هو قو مو قم 


Cumulative 


.0000 
. 0492 
.0781 
.0997 
.1070 
.0945 
.0688 
.0411 












- 2030.48 Prob»chi2 0.0000 
Uniqueness 
0.6439 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
0. 
طريقة تدوير‎ 


العاملية» بينما يسمح بدرجة ما من الارتباط بين العواملء الارتباط بين 
العوامل سوف يكون اسا GY dass locis‏ هذه العوامل لها تباين 
متقاطع؛ وعموماً فقد تكون هذه العوامل ASÍ‏ واقعية إذا تم اعتبار أنها تمثل 
أساساً وليس من الضروري أتها أبعاد لها علاقة بالقضايا البيئية. 
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.rotate, promax 


Factor analysis/correlation Number of obs & 734 
Method: iterated principal factors Retained factors = 2 
Rotation: oblique promax (Kaiser off) Number of params = 19 






Factor Variance Proportion Rotated factors are correlated 
















0.7171 
0.4365 


3.06450 
1.86514 


Factorl 





Factor2 


LR test: independent vs. saturated: chi2(45) = 2030.48 Prob>chi2 = 0.0000 


Rotated factor loadings (pattern matrix) and unique variances 


Factorl Factor2 



















Variable Uniqueness 





forest .6439 
cutting 
losfish 

overfish 

waterl 
water2 
warming 
sprawl 
weather 





OOoOo0o0000000 


losscen 


Factor rotation matrix 







Factorl Factor2 









Factorl 
Factor2 


0.9662 0.6109 
-0.2578 0.7917 





أسئلة الاستقصاء حول تأثيرات جودة colsall‏ أو قضايا إمدادات المياه 
والاحتباس الحراري» والأحداث غير العادية المتعلقة بالطقس والزحف 
العمراني» وخسارة الجمال الطبيعي الخلاب كلها تكون أعلى بكثير في العامل 
الأول 1 cfactor‏ والقلق حول خسارة وظائف ana‏ الأسماك overfish‏ ووظائف 
الغابات eluting‏ نفس التشبع على العاملين الأول والثاني Ae ss dla‏ 
هذا النمط يمكننا تفسير العامل الأول 1 factor‏ على أنه يمثل القضايا البيئية 
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العامة والعامل الثاني 2 factor‏ يمثل القضايا المتعلقة بمصادر الوظائفء الأمر 

predict‏ يقوم بحساب القيم العاملية والتي يتم تعريفها بواسطة المتغيرات 

المركبة كمجاميع للقيم المعيارية للمتغيرات وأوزانها من خلال قيمها العاملية 
المتغيران المركبان الجديدان تم تسميتهما باسم -resjobs s enviro‏ 

.predict enviro resjobs 

(regression scoring assumed) 


Scoring coefficients (method = regression; based on promax(3) rotated factors) 








Factor2 





Variable Factorl 





00448 


forest 0. 0.15784 
cutting 0.12496 0.14577 
losfish 0.01218 0.68645 

overfish 0.13504 0.09935 

waterl 0.18799 0.02717 

water2 0.16724 0.00984 
warming 0.20531 0.00398 

sprawl 0.19251 -0.00430 
weather 0.11661 0.00008 
losscen 0.21054 -0.01245 





.label variable enviro "Pollution, sprawl and 
scenic effects" 

.label variable resjobs "Resource job loss 
effects' 

.summ enviro resjobs 


Variable Obs Mean Std. Dev. Min Max 





enviro 734 -1.38e-09 .9112633 -1.307359 2.209436 
resjobs 734 9.40e-11 .9039373  -1.912148 .9766908 


علماء الاجتماع يقومون بإنشاء متغيرات مركبة جديدة والبحث عن دليل 
عن صدق هذه المتغيرات أو علاقتها مع ما نعتقد أن هذه المتغيرات «Qai‏ 
في هذا المثال هناك نوع واحد من الصدقء وهو الصدق الظاهري والذي 
يدعم بواسطة نمط قابل لشرح التشبع العاملي. النوع الثاني وهو الصدق 
المعياري الذي يمكن اكتشافه باختبار ما إذا كانت المتغيرات الجديدة مرتبطة 
مع متغيرات أخرى التي توقعتها دراسات أو نظريات سابقة» فمثلا أصدق 
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نتيجة من بحث استقصائي حول قضايا البيئة في الولايات المتحدة كانت 
نتيجة انتشار تأثيرات أيديولو.جية أو خط حزب معينء الرسم البياني 
الصندوقي يعرض توزيع القيم على عامل القضايا البيئية (enviro).‏ مع الانتماء 
السياسي للمشاركين في الدراسة Cus party‏ إن الزسم يعرض بوضوح هذا 
النمط المتوقع» في الشكل )7.11( هناك خط أفقي يمثل الوسيط العام والذي 
تم الحصول عليه من نتيجة r(p50)‏ الخاصة بالأمر summarize, detail‏ مع 
أوزان معاينة الاستقصاء التي تستخدم كأوزان تحليلية» ضمن المشاركين في 
الدراسة الذين يعرفون أنفسهم بأنهم جمهوريون لهم قيم عالية للمتغير senviro‏ 
وهذه القيم تظهر وكأنها قيم متطرفة. 

.quietly summ enviro, detail 


.graph box enviro [aw - surveywt], over(party) 
yline(*r(p50) ) 


0 1 2 


Pollution, sprawl and scenic effects 


-1 





Dem Ind Rep 


الشكل )9.11( 


النتيجة الأكثر شيوعاً - والتي كانت ضمن نتائج البحوث السابقة 7 
تتضمن تأثيرات لمر والجنس والتعليم. باحثو CERA‏ مهتمون حول ما إذا 
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كان الإدراك البيئي أو التوعية البيئية للسكان الجدد بالمناطق الريفية يختلف 
عن إدراك السكان الذين يعيشون منذ فترة طويلة. الانحدار المعروض أدناه 
وجد تأثيرات ذات معنوية للتعليم» والانتماء البسياسي؛ والقادمين الجديد» 
المشاركون في الدراسة الذين لهم مستوى تعليم أعلى وهم إما ديمقراطيون أو 
مستقلون وهم Laj‏ عاشوا في المنطقة لأكثر من 5 سنوات فى العادة 
يتفهمون التأثيرات المحلية الناتجة عن المشاكل البيئية. l‏ 
.SVy: regress enviro age-newcomer‏ 


(running regress on estimation sample) 


Survey: Linear regression 


Number of strata  - 1 Number of obs = 734 
Number of PSUs = 734 Population size = 725.97798 
Design df = 733 
F( 5, 729) = 15.64 
Prob > F = 0.0000 
R-squared = 0.1275 







Linearized 
Coef. Std. Err. t P>|t| [95$ Conf. Interval] 









enviro | 










-.0008836 .0027041 -0.33 0.744 .0061923 .004425 
.1037294 — .0807127 1.29 0.199 .0547262 .2621849 
.1037535 — .0383315 2.71 0.007 .0285008 .1790062 

-.2949115  .0430073 -6.86 0.000 .3793436 | -.2104794 

-.2197846 .1089288 -2.02 0.044 .4336341 -.005935 
.2841083 =. 2264291 1.25 0.210 . 1604185 . 7286351 


age 

sex 

educ 
party 
newcomer | 


_cons 





هناك انحدار مشابه مع العامل المتعلق بمصادر الوظائف resjobs‏ والذي 
cl ony‏ هذا (jis Od jaa‏ بالتعليم أو Vary coda‏ من ذلك قان متفر 
العمر والسكان الجدد هما أقوى متغيرات تنبؤية. فصغار السن المشاركون 
في الدراسة والذين انتقلوا للمنطقة خلال السنوات الخمس الماضية في العادة 
Us‏ إدراكاً للتأثيرات الناتجة من خسارة الوظائف في مجال الغابات وصيد 
الأسماك. 


.Svy: regress resjobs age-newcomer 
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Érus 222 cep d ————À—‏ 


(running regress on estimation sample) 


Survey: Linear regression 


Number of strata z 1 Number of obs z 734 
Number of PSUS * 734 Population size = 725.97798 
Design df = 733 
F ( 5, 729) = 6.02 
Prob > F = 0.0000 
R-squared = 0.0792 







Linearized 
Coef. Std. Err. t P»|t| [95% Conf. Interval] 





resjobs 












age .008514' = .0031023 2.74 0.006 .0024235 .0146045 

sex .0826771 .0883132 0.94 0.349 -.0906998 .2560541 

educ .0613762 - 0414013 1.48 0.139 -.0199031 . 1426555 
party -.0835506 .0479571 -1.74 0.082 -.1777002 .010599 
newcomer -.3624841 .1330725 -2.72 0.007 -.6237327 -.1012354 
_cons -.488574 .2391453 -2.04 0.041 -.9580654 -.0190826 






الفياس وممادخ اطعادلة الهيكلية : 


Measurement and Structural Equation Models 





الفصل )8( ألقى نظرة على نماذج المعادلة الهيكلية بداية من مثشال 
Jasiyl‏ « الذي يتضمن علاقات بين مجموعة متغيرات (الشكل 14.8(« 
نماذج المعادلة الهيكلية يمكن أن تشمل نماذج قياس» والتي تشبه التحليل 
العاملي. نماذج القياس تشير إلى واخد أو ASÍ‏ من المتغيرات الكامنة العاملية 
أو غير المشاهدة والتي تسبب تباينا في المتغيرات المشاهدة؛ الشكل )10.11( 
يوضح ذلك باستخدام بيانات استقصاء منطقة شمال غرب المحيط الهادئ 
-CERA‏ 
.use C:\data\PNWsurvey2_11.dta, clear‏ 
يظهر في الشكل (10.11) متغيران كامنان وغير مشاهدين وهما 
-Resjobs «Enviro‏ أسماء هذه المتغيرات تم قصدا وضعهما Cua)‏ تشبه eil‏ 
العاملية في الجزء السابق من هذا الفصلء ولكن في هذا التحليل سوف نبدا 
من جديدء فلا تورجد متغيرات لها نفس هذه الأسماء؛ عند صياغة نموذج 
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المعادلة الهيكلية يقوم برنامج ستاتا (وهذا هو الوضع الافتراضي للبرنامج) 
باتباع طريقة لتمثيل المتغيرات الكامنة مع أسماء تبدأ بحروف كبيرة» المتغير 
الكامن Enviro‏ يتم رسمه بحيث يوضح أن بعضن التباينات في ستة متغيرات 
غير مشاهدة» ونفس هذه المتغيرات يتم تحميلها بشكل رئيس للعامل الأول 
factor 1‏ في الجزء السابق» المتغير الكامن Resjobs.‏ يشر ح التباين في أربعة 
متغيرات غير مشاهدة أخرىء والتي يتم تحميلها بشكل رئيس أو جزئي 
a dactor 2 itll Jalal‏ الان لكل Con gi Ay all‏ 
المتغيرات الكامنة» بينما المستطيلات تعرض المتغيرات المشاهدة» والسهم 
المائل ذو الرأسين يمثل العلاقة غير السببية بين المتغيرين -Resjobs «Enviro‏ 





الشكل (10.11) 


تم إنشاء الشكل أعلاه باستخدام SEM. Builder‏ ببرنامج ستاتاء ويمكنك 
القيام بذلك عن طريق الخطوات التالية: 


Statistics < SEM (structural equation modeling) » Model 
building and estimation 


اختر أداة Add measurement Component (M)‏ من الهامش الأيسر 
للنافدة» e‏ ضع مؤشر الفارة في الموقع الذي تريده للمتغير الكامن بمنطقة 
ceu Jl‏ قم بإعطاء المتغير الكامن اسما يبدأ بحرف كبير مثل Enviro‏ شم 
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اختر متغيرات القياس ád Measurement variables‏ شرحها بواسطة 
المتغير الكامن؛ وذلك باختيار أسمائها من قائمة» بعد ذلك قم باختيار اتجاه 
Measurement direction sha‏ مثل UP‏ واضغط (OK‏ ثم قم بإعادة هذه 
الخطوات مع المتغير الكامن الثاني في موقع آخر مثل Resjobs‏ مع وضع 
Measurement direction‏ إلى Down‏ ثم اضغط OK‏ مرة أخرىء أخيرا 
قم باستخدام أداة Add covariance (C)‏ من الهامش الأيسر وذلك لوضع 
السهم المنحني ذي الرأسين للتباين أو الارتباط بين المتغيرات الكامنة. 

مسار أنها من المتغيرات: الكامكة إلى الفتغيرات الئتتاهدة ULP EPUM EC‏ 
الارتباط Glad‏ وهي تشبه التشبعات العاملية. كل متغير مشاهد له قيمة 
تساوي قيمة تباينه الفريدة والتي تعطي بواسطة شروط O‏ (إيسلون (epsilon‏ 
في نموذج المسار هذاء المتغيران Resjobs g Enviro‏ لهما ارتباط يساوي 0.62. 





الشكل (11.11) 


عند رسم نموذج مسار مثل الذي يظهر في الشكل (10.11) قم بالنقر 
على Estimate‏ وسوف ترى أن النتائج الإحصائية Gla‏ بالظهور على 
الرسم البياني. qao:‏ ستاتا يعرض معلومات كثيرة افتراضياء ولكن لبعض 
الأغراض - مثل أغراض النشر - قد نحتاج إلى الاحتفاظ بالرسم بشكل 
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dead‏ الشكل )11.11( يتضمن أوزان الاستقصاء. ومُعاملات الانحدار 
المعيارية أو التباينات. ويتم عرض كل ذلك في تنسيق ثابت مع رقمين في 
يمين الفاصلة العشريةء ei‏ تبسيط الرسم البياني والتحكم فيه من خلال 
خيارات القوائم التالية: 


Settings > Variables > All ... > Results > Exogenous variables > 
None > OK 


Settings > Variables > All ... > Results > Endogenous variables 
> None > OK 


Settings > Variables > Error ... > Results > Error std. variance > 
Songs > Connections > Paths > Results > Std. parameter > 


Settings > Connections > All > Results > Result 1 > Format 
%3.2f > OK > OK 


Estimation > Estimate > Weights > Sampling weights . 
(surveywt (قم باختيار متغيرات مثل‎ > OK 

نفس النموذج يمكن تقديره مباشرة عن طريق الأمر sem.‏ بدون استخدام 
«SEM Builder‏ في الأمر أدناه لاحظ استخدام svy:‏ قبل الأمر والتي تقوم 
بتطبيق وزن للاستقصاء للأمر sem‏ كما قامت بفعله من قبل مع الأمر 
regress‏ والعديد من عمليات ستاتا الأخرىء المُعاملات المعيارية من هذه 
المخرجات تتوافق مع مُعَاملات المسار في الشكل )11.11( كما أن التباينات 
الفريدة الخاصة بالمتغيرات المشاهدة والتغاير المعياري (أي الارتباط) بين 
المتغيرات الكامنة» وبالمثل فإنها تتوافق مع القيم المعروضة في الشكل 


.)11.11( 
-Svy: sem (Enviro ->waterl  water2 warming 
sprawl weather losscen) (Resjobs ->forest 
cutting losfish overfish), standard 
(running sem on estimation sample) 
Survey: Structural equation model 
Number of strata ' = 1 Number of obs = . 4 
Number of PSUS z 734 Population size = 725.97798 
Design df = 733 


(1) [waterl]Enviro = 1 
(2) [forest]Resjobs = 1 


الإحصاء مع برنامج ستاتا 
a‏ الا ا س د 


Standardi zed 


Measurement 
waterl <- 
Enviro 
_cons 


water2 <- 
Enviro 
_cons 


warming <- 
Enviro 
_cons 


sprawl <- 
Enviro 
_cons 


weather <- 
Enviro 
-cons 


losscen <- 
Enviro 
-cons 


forest <- 
Resjobs 
_cons 


cutting <- 
Resjobs 
_cons 


losfish <- 
Resjobs 
_cons 


overfish <- 
Resjobs 
-cons 


Coef. 


.6617216 


.9865716. 


.6474885 
.6092422 


.6604354 
.9570574 


.6331502 
.8070991 


.4872326 
1.229424 


.6868967 
.8308351 


.4351381 
1.701551 


.5800483 
1.086461 


.611518 
1.699434 


- 7640356 
1.211127 


Linearized 
Std. Err. 


.0305711 
.0405518 


.033683 
.0301459 


.0295415 
.0398204 


.0394133 
.0351607 


.0408934 
.0493018 


.0336976 
.0357022 


.0782853 
.0851467 


.0483413 
.0455767 


.0646856 
.0899735 


.0396915 
.0531622 


19. 
22. 


t 


25 
78 


0.000 


0.000. 


0.000 


0.000 
0.000 


[95$ Conf. 


.6017043 
.9069601 


.5813618 
.5500596 


.6024393 
.8788818 


.5557738 
.7380715 


-4069505 
1.132634 


.6207413 
.7607443 


2814481 
1.534391 


.4851445 
. 7 


. 4845268 
1.522798 


.686113 
1.106759 


540 


Interval] 


.7217389 
1.066183 


.7136151 
.6684249 


.7184315 
1.035233 


.7105265 
.8761267 


.5675148 
1.326213 


.7530521 
.9009259 


.5888282 
1.868712 


.6749521 
1.175938 


.7385092 
1.876071 


.8419582 
1.315495 
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Variance 

e.waterl .5621246 .0404591 .4880516 .6474398 

e.water2 .5807587 .0436187 .5011403 .6730265 
e.warming .563825 .0390206 .4921959 .6458784 

e.sprawl .5991209 .049909 .5087318 .7055699 
e.weather .7626044 . 0398492 .6882511 .6449901 
e.losscen .5281729 :0462936 .4446786 .6273445 

e.forest .8106548 .0681298 .6873535 .9560745 
e.cutting .663544 .0560805 .5620954 .7833023 
e.losfish .6260458 .0791129 .4884978 .8023236 
e.overfish .4162496 .0606515 .3126948 .5540985 

Enviro 1 arts 
Resjobs 1 






Covariance 
Enviro 


Resjobs . 61948608 . 0603082 10.27 0.000 .5010833 .7378782 





الشكل )12.11( يعرض مثالاً يتم فيه دمج نموذج قياس (متغير كامن 
Enviro‏ موضحا التباين في ستة متغيرات مشاهدة» وهي من المتغير water]‏ 
وحتى المتغير (losscen‏ مع نموذج انحدار يكون فيه المتغير Enviro‏ نفسه يتم 
تفسيره بواسطة خمسة متغيرات خلفية مشاهدة» وهي من متغير age‏ وحتى متغير 
«newcomer‏ وبالتالي فإن الشكل )12.11( يشبه التحليل الذي قمنا به ني الجزء 
السابق آخذأ القيم العاملية للمتغير enviro‏ كمتغير تابع له انحدار على المتغيرات 
من المتغير ءع» وحتى المتغير newcomer‏ طريقة المعادلة المركبة تقوم بدمج 
سمات التحليل العاملي والانحدار في نموذج coals‏ والطريقة تقوم بتقدير واختبار 
مدى واسعاً من الطرق الأخرى لصياغة النماذج مثل ارتباطات الأخطاء 
والعلاقات التي تتضمن المتغيرات الكامنة أو المتغيرات المشاهدة الأخرى. 





الشكل (12.11) 
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ا ا ا 
الأمر التالي يقوم بتقدير نفس النموذج الذي شاهدناه في الشكل )12.11( 

مع تفاصيل أكثر. 

.Svy: sem (Enviro -»waterl  water2 warming 


sprawl weather losscen) (age sex educ party 


newcomer -»Enviro), standard 
(running sem on estimation sample) 


Survey: Structural equation model 


Number of strata = 1 Number of obs = 734 
Number of PSUs = 734 Population size = 725.97798 
Design df = 733 


(1) (waterl]Enviro = 1 









Linearized 


Standardized Coef. Std. Err. t P»|t| (95% Conf. Interval] 


Structural 


Enviro «- 
age -.049815 .0575978 -0.86 0.387 -.1628914 .0632614 
sex .0613274 .051095 1.20 0.230 -.0389826 .1616375 
educ .1203573 .0491607 2.45 0.015 ` .0238449 .2168698 
party -.3127998 .0500495 -6.25 0.000 -.4110573 -.2145423 
newcomer -.1093366 .0540813 -2.02 0.044 -.2155094 -.0031639 
Measurement > 
waterl <- 
Enviro .6428964 .0331036 19.42 0.000 .5779073 .7078856 
_cons 1.310619 . 1795706 7.30 0.000 .9580847 1.663153 
water2 «- 
Enviro .6245504 .0376486 16,59 0.000 .5506384 .6984623 
_cons . 92407 .1715633 5.39 0.000 .5872266 1.260855 
warming «- 
Enviro .6783106 .0304815 22.25 0.000 .6184691 .7381521 
-cons 1.298954 .1864988 6.96 0.000 .9328181 1.665089 
sprawl «- 
Enviro .6309674 .0405903 15.54 0.000 .5512803 .7106546 
-cons 1.125132 .1758644 6.40 0.000 -7798741 1.47039 
weather <- 
Enviro .5098352 .0405605 12.57 0.000 .4302065 .5894638 
_cons 1.486401 - 1467739 10.13 0.000 1.198254 1.774549 
losscen «- 
: prd 
Enviro .6949899 .034121 20.37 0.000 -6280033 .7619764 


_cons 1.181138 - 1923889 6.14 0.000 - 8034391 1.558837 
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Variance 


e.waterl .5866842 .0425644 .5087998 .6764906 
e.water2 .6099368 .0470269 .5242611 .7096139 
e.warming .5398947 .0413519 .4645213 .6274983 
e.sprawl .6018801 10512223 5092718 .7113288 
e.weather .7400681 .0413584 .6631687 .8258846 
e.losscen .5169891 .0474275 .4317822 .6190105 


.9327815 





.8027214 






e.Enviro .8653113 





.0330933 





Gas. y‏ بأن المتغيرات educ, party, newcomer‏ جميعها لها تأثيرات ذات 
معنوية إحصائية على المتغير الكامن Enviro‏ بينما المتغيرين age, sex‏ ليس 
لهما هذا التأثير. هذه النتائج تتوافق مع النتائج السابقة لانحدار القيم العاملية 
enviro‏ على نفس متغيرات التنبؤية الخمسة. | 

. موضوع gii‏ المعادلة الهيكلية مع برنامج ستاتا هو موضوع واسع 

RON‏ كايا اا له وحده. ALY!‏ في هذا الفصل وتلك التي تم تناولها في 
الفصل (8) كانت عبارة عن نظرة سريعة. وللحصول على شرح كامل 
n‏ امر قم بالاطلاع على لل المستخدم Structural Equation Modeling‏ 
«Reference. Manual‏ كما يحتوي هذا الدليل على نحو مكتبة بها 26 Yuu.‏ 
تسهل عملية الفهم للقارئ 


4 


(الفعتل (لتا حار 
تحليل السلاسل الزمنية 


Time Series Analysis 





قدرات برنامج ستاتا مع السلاسل الزمنية تم تغطيتها في 700 صفحة 
بدليل المستخدم .Time-Series Reference Manual‏ هذا. الفصل يعطي مقدمة 
fag pratica‏ مم ott‏ كان Whee tals‏ وماك EEE‏ 
والتمهيد. ثم ننتقل إلى توضيح استخدام تصوير «dau jy!‏ ونماذج ARIMA‏ 
«lee ARMAX 5‏ مع الاختبارات التشخيصية للاستقرارية stationarity‏ 
والضجة البيضاء white noise‏ هناك تطبيقات أخرى وأهمها شكل الذبذبات» 
ومجموعة نماذج ARCH‏ المرنة تم تركها للقارئ للبحث عنها واستكشافها. 
وبالرغم من أن الحلول التقنية لموضوعات السلاسل الزمنية يمكن 
العثور عليها في دراسة Hamilton‏ )1994( وهناك مصادر أخرى تتضمن 
lua‏ دراسة Box, Jenkins and Reinsel (1994), Chatfield (2004), Diggle‏ 
Enders (2004) and Shumway (1988)‏ ,)1990(- 
ail gf‏ عمليات تحليل السلاسل الزمنية تأتي تحت العناوين التالية: 
Statistics < Time series‏ 
Statistics < Multivariate time series‏ 


Statistics » Cross-sectional time series 
Graphics < Time-series graphs 


Example Commands : عن الأوأمر‎ alivi 





-ac y, lags(8) level(95) generate(newvar) 
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يقوم بإنشاء رسم بياني للارتباطات الذاتية للمتغير qus y‏ فقرات ثقة 
5 (هذا هو الوضع الافتراضي للبرنامج) لفترات تباطؤ من 1 وحتى B‏ 
ويقوم بحفظ الارتباطات الذاتية كأول 8 قيم للمتغير .newvar‏ 
earch D.y, arch(i/3) ar(1) ma(1)‏ 
يقوم بتوفيق ARCH‏ (الانحدار الذاتي لاختلاف التباين المشروط 
(autoregressive conditional heteroskedasticity‏ نموذج مع أول اختلافات 
للمتغير برء وهذا يتضمن شروط ARCH‏ من الدرجة الأولى وحتى الدرجة 
الثالثة» والدرجة الأولى لأخطاء .MA s AR‏ 
-arima y, arima(1,1,1)‏ 
يقوم بتوافق عينة مع نموذج ARIMA(LI,I)‏ مع اختلاف الدرجة الأولى 
وشروط اختلاف الدرجة الأولى «MA s AR‏ الخيارات المحتملة الأخرى 
يمكنها تحديد استراتيجيات تقدير بديلة والقيود الخطية والتقديرات الموثوقة 
.arima y, arima(1,0,2) sarima(1,0,1,12)‏ 
يقوم بتوافق نموذج ARIMA(L0,2)«(1,0,1)i‏ مع شروط AR‏ من الدرجة 
«ul gil‏ وشروط MA‏ من الدرجتين الأولى والثانيةء وكذلك مع المكونات 
الموسمية المضاعفة مع فترة 12. ۰ 
.arima y x1 x2 x3, arima(2,0,1)‏ 
يقوم بحساب ARMAX jas‏ (المتوسط المتحرك للانحدار الذاتي مع 
المتغيرات الخارجية) للمتغير بر على ثلاثة متغيرات تنبؤية. الأخطاء تم 
صياغتها كمتوسط متحرك من الدرجة الأولى؛ وانحدار ذاتي من الدرجة 
الثانية. 
.arima D.y x1 L1.x1 x2, ar(1) ma(1 12)‏ 
يقوم بتوافق نموذج ARMAX‏ والذي فيه اختلافات أولية للمتغير رتم 
حساب اتحدارها على المتغير x]‏ مع ed‏ لها فترات تباطؤ 1- للمتغير x]‏ 


-AR(1), MA(1), MA(12) والمتغير 2× وهذا يتضمن أخطاء‎ 
-corrgram y, lags(8) 
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يقوم بحساب الارتباطات الذاتيةء والارتباطات الذاتية الجزئية: 
واختبارات © لفترات تباطؤ من 1 وحتى 8 للمتغير y‏ 


.dfuller y 
للاستقرارية‎ Dickey-Fuller يقوم بحساب اختبار جذر وحدة ديكي فولر‎ 


«stationarity 
-estat dwatson 
يمحساب‎ sel مع بيانات سلاسل زمنية يقوم الأمر‎ regress بعد الأمر‎ 
لاختبار الارتباط الذاتي من الدرجة‎ Durbin-Watson إحصائية دوربن واتسون‎ 
الأولى.‎ 
.egen newvar = ma(y), nomiss t(7) 
يساوي فترة 7— ناقلاً متوسط المتغير ر‎ newvar يقوم بإنشاء متغير جديد‎ 
ومستبدلاً قيم البداية والنهاية بمتوسطات أقصر وغير مركزية.‎ 
.generate date - mdy(month,day,year) 
يناير 1960 من ثلاثة‎ 1 Xa يساوي عدد الأيام‎ date يقوم بإنشاء متغير‎ 
month, day, year متغير ات هي‎ 


.generate date = date(str date, "mdy') 


يقوم بإنشاء متغير date‏ من متغير نصي «str. date‏ حيث إن str date‏ 
يحتوي على تواريخ يكون ترتيبها شهر ويوم وسنة ويكون تنسيقها ie‏ 
June, 12”‏ ,1948“ أو ”98/4/18“ أو ”2001/11/19»: ولمعرفة دوال «cei JI‏ 
والخيارات الأخرىء قم بطباعة الأمر -help dates‏ 
.generate newvar = L3.y‏ 
يقوم بإنشاء متغير جديد newvar‏ يساوي قيم المتغير ر مع فترة تباطؤ 3 
-pac y, lags(8) yline(0) ciopts (bstyle (outline) )‏ 
يقوم بإنشاء رسم بياني للارتباطات الذاتية الجزئية مع فترات ثقة وتباين 
متبقي من فترة تباطؤ 1 وحتى فترة hts‏ 8 ويقوم بإنشاء خط أفقي عند 
نقطة 0: ويقوم الأمر بعرض فترة الثقة كخط عريض بدلا من منطقة مضللة 
(والأخير هو الوضع الافتراضي). 
.pergram v, generate(newvar)‏ 
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يقوم برسم عينة ذبذبات (دالة كثافة الطيف) للمتغير y.‏ « وإنشاء متغير 
جديد باسم newvar‏ يساوي قيم الذبذبات الخام. 
-smooth 73 y, generate(newvar)‏ 
يقوم بإنشاء متغير جديد newvar‏ يساوي الفترة الزمنية es reno o9‏ 
الوسيط للمتغير بر ثم يقوم بإعادة التمهيد باس تخدام الفترة الزمنية 3- 
مستخدما قيم الوسيط التمهيد المركب مثل *3RSSH"‏ أو “4253h,twice”‏ 
تكون محتملة» وللحصول على معلومات أكثر عن المُرشحات والتمهيدات قم 
بطباعة help smooth Vl‏ أو .help tssmooth‏ 
.tsset date, format (%td)‏ 
يقوم باعتبار البيانات وكأنها بيانات سلاسل زمنيةء حيث تم الإشارة إلى 
الوقت باستخدام المتغير date‏ والذي يكون تنسيقه على أساس يوميء أما 
بالنسبة للبيانات الطويلة panel data‏ مع السلاسل الزمنية المتوازية لعدد من 
الوحدات المختلفة مثل المدن» فإن الأمر tsset city year‏ يقوم بتحديد متغيرات 
الزمن والطول للبيانات» أغلب الأوامر في هذا الفصل تتطلب استخدام الأمر 
tsset‏ مع البيانات. 
.tssmooth ma newvar = y, window(2 1 2)‏ 
يقوم بتطبيق ect jl‏ المتوسط المتحرك للمتغير «رمؤديا إلى إنشاء متغير 
جدید باسم cnewvar‏ الخيار )2 1 window(2‏ و جد بأن المسافة الزمنية 5- 
للمتوسط المتحرك وذلك من خلال إدراج فترات shla‏ تساوي 2 وإدراج 
المشاهدة الحالية و2 من القيم الأساسية في حساب كل نقطة تمهيدية. 
وللحصول على قائمة المرشحات الأخرى المتوافرة والمتوسطات المتحركة 
الموزونة والأسيّة والأسيّة المزدوجة وهولت - وينترس Holt-Winters‏ وغير 
الخطيةء قم بطباعة الأمر -help tssmooth‏ 
-Cssmooth nl newvar = y, smoother(4253h,twice)‏ 
يقوم بتطبيق مرشح التمهيد غير الخطي على المتغير بر مؤديا إلى إنشاء 
متغير جديد cnewvar‏ الخيار smoother(4253h, twice)‏ يقوم بشكل تكراري 
بإيجاد قيم الوسيط لمسافات زمنية هي 4 Q2‏ 5» 3 ثم تطبيق دالة qu‏ 
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8 وبعد ذلك يقوم بتكرار العملية مع البواقي. الأمر tssmooth nl‏ 
يختلف عن باقي أوامر Cum ctssmooth‏ لا يمكنه العمل مع القيم المفقودة. 
.wntestq y, 1395 )15(‏ 
يقوم باحتساب اختبار 0 Liung-Box portmanteau‏ للضجة البيضاء white‏ 
US) noise‏ يمكن حساب هذا الاختبار باستخدام الأمر (corrgram‏ 
.Xcorr x y, lags(8) xline(0)‏ 
يقوم بإنشاء رسم بياني للارتباط المتقاطع بين مدخلات (x)‏ ومخرجات 
(y)‏ لفترات تباطؤ من 8-1. xcorr x y, table LAN)‏ يعطي نسخة نصية 
تتضمن الارتباطات الفعلية. وإذا قمنا بإضافة الخيار generate(newvar)‏ إلى 
الأمر xcorr‏ فسوف يتم حفظ الارتباطات لفترات التباطؤ من 8- وحتى 8+ 
كمتغير في أل 17 سينا مق البيانات: 
Smoothing : uàni)\‏ | 


العديد من السلاسل الزمنية يكون لها تباينات dalle‏ التردد تجعمل من 
الصعب توضيح الأنماط الكامنةء Jia smoothing weed‏ هذه السلاسل تقوم 
بتقسيم البيانات إلى جزعين» الأول يتباين بشكل تدريجي» والشاني 'تقريبا"' 
يحتوي على التغيرات الكبيرة المتبقية: 
البيانات = التمهيد + التقريب 
ولتوضيح طرق التمهيد سوف نقوم باختبار بيانات عن الاستهلاك 
اليومي للمياه لقرية ميلفورد Milford‏ بولاية هامبشير Hampshire‏ بالولايات 
المتحدة خلال فترة سبعة أشهر من يناير وحتى يوليو 1983 (البيانات بالملف 
«MILwater.dta‏ المصدر : دراسة Hamilton‏ 1985(« الأنماط المعتادة لاستخدام .. 
المياه في ميلفورد كانت قد تغيرت بواسطة الأخبار المقلقة التي حدثت في 
تلف رة d. pall‏ 
.describe‏ 
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Contains data from C:\data\MILwater.dta 


obs: 212 Milford daily water use, 1/1/83 - 7/31/83 
vars: 4 2 Jul 2012 06:11 
size: 1,272 
storage display value 
variable name type format label variable label 
month byte %9.0g Month 
day byte %9.0g Date 
year int &9.0g Year 
water int 59.09 Water use in 1000 gallons 
Sorted by: 


قبل التعمق في التحليل» سوف نحتاج إلى تحويل معلومات الشهر واليوم 
والسنة إلى مؤشر رقمي واحد للزمن. دالة برنامج mdy( ) uuu‏ تقوم بهذا 
التحويل» حيث تقوم بإنشاء متغير الوقت الماضي (والذي سوف نطلق عليه 
هنا (date‏ مشيراً إلى عدد الأيام die‏ 1 يناير 1960. 


.generate date = mdy(month, day, year) 
.list in 1/5 


month day year water date 


wm حل‎ C) N بم‎ 





التاريخ المرجعي وهو 1 يناير 1960 هو تاريخ عشوائي ولكن ثابتاء 
يمكننا أن نجعل تنسيق التاريخ أكثر Lagi‏ للمتغير dore‏ كما يمكننا تجهيز 
البيانات للتحليل لاحقاء وذلك باستخدام الأمر teset‏ (وهو اختصار للحروف 
الأولى من كلمة بيانات سلاسل زمنية (time series set‏ لتحديد التاريخ date‏ 
كمتغير لمؤشر الزمن» وتحديد الخيار Yotd(daily)‏ لعرض هذا المتغير. 
-tsset date, format (%td)‏ 
tame variable: date, 01jan1983 to 31ju11983‏ 


ELAS. X dau سبو‎ 
IEE ع‎ 175 
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month day year water 


01jan1983 
02jan1983 
03jan1983 
04jan1983 
05jan1983 


OF نبا‎ Il بم‎ 





التواريخ في المتغير الجديد date‏ لها تنسيق jan 05" Sie‏ 61983 وهو 
أكثر فهماً وقراءة عن القيم الرقمية المجردة Jia‏ ”8405“ (وهو عبارة عن 
aae‏ الأيام منذ 1 يناير 1960(« كما يمكننا استخدام التنسيق %4 لإنتاج 
تنسيقات أخرى مثل ”05 Jan‏ 1983“ أو 07. برنامج ستاتا يوفر عددا 
من المتغيرات التعريفية» زعددا من تنسيقات العرض وتنسيقات البيانات التي 
لها أهميتها مع السلاسل الزمنية. العديد من هذه التنسيقات يتضمن طرقا 
للمدخلات والتحويلات وعرض التواريخ. ويمكنك الحصول على شرح 
مفصل عن دوال التوازيخ في Jala‏ المستخدم Data Management Reference‏ 
Manual‏ ودليل المستخدم User's Guide‏ أو يمكنك الاطلاع عليها بطباعة 
الأمر -help dates‏ 
الشكل (1.12) يستخدم شكلاً ER‏ من نوع twoway line‏ لرسم شكل 
بياني بسيط لمتغير استخدام المياه water‏ مع الزمن date‏ الشكل يعرض lai‏ 
تباين يوم بيوم» كما يوضح أن هناك ارتفاعاً في استخدام المياه في الصيف› 
قيم متغير التاريخ تم وصفها تلقائيا )01 jan‏ 1983 وهكذا) على المحور الأفقي 
» » ولكن خيارات ستاتا الافتراضية هنا تقود إلى نتائج غير مرضية؛ 
qul Rad jin ligas gy‏ ال 1 
-graph twoway line waterdate‏ 
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الشكل )1.12( 


هناك طريقة أفضل لرسم الزمن»ء واستخدام متغير التاريخ على المحور 
الأفقي ox‏ ويتم ذلك باستخدام أمر خاص بالسلاسل الزمنية وهو stsline‏ هذا 
الأمر يسمح لنا بشرح قيم المحور × في ضوء التاريخ بدون الحاجة إلى 
التواريخ في أسفل المحور. فمثلا يمكننا رسم شكل يوضح الوقت يشبه الشكل 
(1.12) ولكن توصيفات المحور الأفقي لن تكون متزاحمة كما في الشكل 
(1.12). لاحظ أن tsline. oY!‏ لا يقبل أي متغير من متغيرات ox‏ فهو يقبل 
فقط واحد أو أكثر من متغيرات بره مع بيانات tsset‏ أن سمة الوقت تم تعريفها 
مسبقاء والخيارات ( tlabel(‏ و( ttick(‏ تعمل في الرسم البياني #«ناوةء كما 
تعمل الخيارات ) xtick( )5 xlabel(‏ مع أي شكل ily‏ من النوع twoway‏ 
باستثناء أنها تفهم تنسيقا Ge‏ للوقت مثل 01 jan‏ 61983 في الشكل )2.12( 
قمنا باختصار عناوين المحور الأفقي + (الوقت أو محور (r‏ باستخدام الخيار 
title ”)‏ لأن كلمة تاريخ “Date”‏ تبدو غير ضرورية أسفل المحور الأفقي 
الذي تم توصيفه 01 mar 01 «1983 jan‏ 1983 وهكذا. 
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.tsline water, ylabel(300(100)900) ttitle("") 
tlabel(01jan1983 O1mari983 O01may1983 
01ju11983, grid) 


ttick(01feb1983 01apr1983 01jun1983 
01aug1983) 





Water use In 1000 gallons 
500 600 700 800 900 


400 
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الشكل )2.12( 


الفحص بالعين المجردة يلعب دور! رئيساً في السلاسل الزمنية. فالتمهيد 
يساعدنا في أن نرى الأنماط الكامنة تحت السلاسل المتذبذبة. طريقة التمهيد 
الأبسط يتم استخدامها لحساب المتوسط المتحرك عند كل نقطة زمنية بناءً 
على القيم الحالية والسابقة واللاحقة للمتغير بر. فمثلا 'المتوسط المتحرك 
فترة الزمنية 3" يشير إلى المتوسط yu‏ ,برء ١٠بر‏ ويمكننا استخدام مميزات 
ستاتا لإنشاء generate‏ مثل هذا المتغير: 


.generate. water3a = (water[ n-1] + water[ n] + 
water[ n*1]1)/3 


الطريقة الأفضل تتضمن ma‏ (المتوسط المتحرك) كدالة للأمر regen‏ 
.egen water3b - ma(water), nomiss t(3)‏ 
الخيار nomiss‏ فى الأمر egen‏ يجعل المتوسطات المتحركة أقصر وغير 
مركز فى Gb!‏ المتحتى» IY‏ لم فق plastids‏ هذا الخيان قن أول وأخر 
قيمة للمتغير water.‏ سوف تكون Lad‏ مفقودة. الخيار )3( يجعل المتوسط 
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O oss‏ ای رسج س 


المتحرك يكون للفترة الزمنية 3» وأي عدد إضافي للفترة الزمنية 3 أو أكثر 
يمكن استخدامه. 


هناك أدوات تمهيد قوية متوافرة لبيانات السلاسل الزمنية (tsset)‏ ويتم 
استخدامها من خلال الأو !54 «tssmooth.‏ كلها يمكنها التعامل مع البيانات 
المفقودة باستثناء tssmooth nl‏ 
tssmooth ma‏ مُرشحات المتوسط المتحرك أو الموزونة أو غير 
الموزونة. 
lac yal tssmooth exponential‏ الأسيّة الفردية. 


Aa 92 all المر شحات الأسيّة‎ tssmooth 
dexponential 


aŭ  tssmooth hwinters‏ هلت — وينترز Holt-Winters‏ غير الموسمية. 
tssmooth shwinters‏ تمهيد هلت - وينترز Holt-Winters‏ الموسمية. 
tssmooth nl‏ المُرشحات غير الخطية. 
فعلى سبيل المثالء فإن الأمر tssmooth ma‏ يمكنه حساب المتوسطات 
المتحركة للفترة الزمنية 3» وهي مطابقة لتلك الناتجة من egen yal‏ السابق: 


.tssmooth ma water3c - water, window(1 1 1) 
The smoother applied was 


(1/3)*[x(t-1) + 1*x(t) + x(t«1)]; x(t)- water 
أو الأمر‎ help tssmooth ma لمعرفة تركيبة كل أمرء قم بطباعة الأمر‎ 
-help tssmooth exponential 
الشكل )3.12( يرسم المتوسط المتحرك لخمسة أيام لاستخدام المياه في‎ 
يقوم‎ tsline الأمر‎ (water) معا مع البيانات الخام‎ (water5) قرية ميلفورد‎ 
الممهد على الرسم البياني للقيم‎ warer5 بتركيب رسم الفترة الزمنية لقيم المتغير‎ 
توصيفات المحور الأفقي تم إنشاؤها‎ (x Jil (خط‎ water الخام للمتغير‎ 
باستخدام التواريخ كما فعلنا سابقا مع الشكل (2.12). في الشكل )3.12( قمنا‎ 
بتحديد تنسيق عرض مبسط للتاريخ معطيا فقط الشهر راليوم‎ 
هذا التنسيق المبسط للتاريخ يترك مسافة لتوصيف بد.ية كل‎ «format(%tdmd) 
.)2.12( شهر في هذا الرّسم خلافا لكل شهر آخرء كما تم سابقا في الشكل‎ 
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-tssmooth ma water5 = water, window(2 1 2) 
The smoother applied was l 
(1/5)*[x(t-2)+ x(t-1)+ 1*x(t)+x(t+1)+x(t+2)]; x(t)=water 
.tsline water, clwidth(medium) 
|| tsline water5, clwidth(medthick) 
|| , ylabe1(300(100)900) ytitle("Water use 
in 1000 gallons") 
ttitle("") tlabel(01jan1983 01feb1983 
021953 3 
0173331983 0131321983 0131111983 01231161983 , 
grid format (%tdmd) ) 
legend(position(4) ring(0) rows(2) 
label(1 "daily water use") label(2 "5-day 
average")) 
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الشكل )3.12( 


المتوسطات المتحركة تشترك مع الإحصائيات الأخرى التي تعتمد على 
المتوسط في عيب واحدء وهو أنها أقل مقاومة للقيم المتطرفة. وحيث إن القيم 
المتطرفة واضحة من الحواف المدببة البارزة في السلاسل الزمنية للمياه 
بالشكل أعلاه؛ لذلك فإننا قد نقوم بمحاولة استخدام طريقة تمهيد أكثر مقاومة 
للقيم المتطرفة. الأمر tssmooth nl‏ يقوم بتمهيد غير خطي مقاوم للقيم 
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المتطرفة Lain‏ طرقا ومصطلحات تم شرحها في دراسة Velleman and‏ 
Hoaglin‏ )1981( ودراسة Velleman‏ )1982( فعلى سبيل المثال: 
.-tssmooth nl water5r = water, smoother (5)‏ 
يتم إنشاء متغير Mam‏ باسم waterSr‏ يحتوي على a‏ المتغير water‏ بعد 
تمهيدها بواسطة استخدام قيم الوسيط لفترة زمنية 5( المُمهدات المركبة 
باستخدام قيم الوسيط المتعلقة بالفترات الزمنية مع مجموعة Alla‏ هانج Ya)‏ 
2 14- للمتوسط المتحرك الموزون لفترة زمنية تساوي 3) وتقنيات أخرى 
يمكنها تحديد الرمز الأصلي لفالمان «Velleman‏ الممهّد المركب الواحد الذي 
يبدو Vande‏ مع البيانات التي تتغير بسرعة يُطلق عليه “4253h, twice"‏ 
وبتطبيق هذا المُمهد على متغير water‏ يمكننا حساب المتغير الممهد -waterdr‏ 


.tssmooth nl water4r z water, smoother 
(4253h,twice) 


الشكل (4.12) يعرض المتغيرات الممهدة الجديدة waterdr‏ » وبمقارنة 
oS A‏ )12 .4( مع الشكل )12 .3 c‏ كيف أن الممهد 4253h, twice‏ كان 
ad‏ مقاريا elsi gall‏ رة رة auod‏ 55( وبال غم من أن كلذ 
التمهيدين لهما فترات زمنية متشابهةء à‏ الخيار 4253h, twice‏ قام بتخفيض 
أكثر للتباينات المدببة بالرسم. 


600 700 800 900 


Water use in 1000 gallons 


500 


400 


daily water use 
4253h, twich smooth 





300 





Jan1 Feb1 Mar1 Apri Mayt Jun1 Jul1 Aug! 


= الشكل )4.12( 
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في بعض الأحيان» هدفنا الرئيسي من التمهيدء هو البحث عن نمط في 
الرسم البياني للتمهيد. ومع هذه البيانات Lagai‏ فإن البواقي أو قاع السلسلة 
بعد التمهيد يكون أكثر إثارة. ويمكننا أن نحسب القاع كفرق بين البيانات 
والتمهيد» ثم نقوم بتمثيل البواقي Lily‏ مع فتراتها الزمنية» كما فعلنا سابقاً في 
الشكل (5.12). 


.generate rough = water - water4r 
.label variable rough "Residuals from 4253h, 


twice' 
-tsline rough, ttitle(") 
tlabel(01jan1983 01feb1983 01321983 3 


Olmay1983 01jun1983 0131111983 01augi1983, grid 
format (%tdmd) ) 
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الشكل )5.12( 


أقوى التقلبات في الشكل )5.12( حدثت في الفقترة ما بين 29-27 
مارس. استخدام المياه انخفض فجأة ثم ازداد مرة «s yal‏ وبعد ذلك عاد 
لينخفض بشكل dil‏ ثم ارتفع بشكل أكبر قبل الاستقرار في مستوياته 
المعتادة. في هذه الفترة الصحف المحلية كانت تتحدث عن النفايات الكيميائية 
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الخطيرة التي تم اكتشافها في واحد من الآبار التي تقوم بتزويد القرية بالماء. 
التقارير الأولية حذرت الناس» وانخفض استهلاك المياه بشكل ملحوظ. خلال 
الأيام التالية استخدام المياه تراوح ما بين أعلى وأقل قمة في المنحنىء وذلك 
كرد فعل للتطورات الجديدة في الاستهلاك للاستخدام في الفقرة الأخيرة 
وعادت الأشياء للاستقرار من جديد بعد أن تم استبعاد البئر موضع التساؤل 
من الخدمة. 

: للزمن‎ dull أكثر عن الرسومات‎ aliol 


Further Time Plot Examples 


البيانات الموجودة بالملف Greenland temperature.dta‏ تتضمن ALL la‏ 
زمنية معروفة لتقديرات درجة الحرارة والتي تم sale}‏ إنشائها من GISP2‏ 
جليد جرينلاندء حيث تغطي البيانات فترة زمنية تصل إلى 50,000 سنة 
ماضية حتى سنة 1855 (دراسة Alley‏ 2004). في المنشورات العلمية عن 
هذا النوع من البيانات» يتم تمثيل الزمن باستخدام متغير age‏ الذي يستخدم 
وحدات تمثل آلاف السنوات الماضية. "الوقت الحالي" تم تعريفه بواسطة 
الباحثين في مجال الجليد بأنه يعني سنة 1950( وأحدث البيانات الموجودة 
بمتغير age‏ هي 0.095 أو 95 سنة ماضية» أو بعبارة أخرى هي سنة 
5. الجليد والتلوج للسنوات الأخيرة لم تكن متراكمة Ley‏ فيه QUST‏ حتى 
نطبّق عليها طريقة إعادة تركيب درجة الحرارة. ولجعل بيانات مثالنا أكثر 
وضوحاً لغير المتخصصين في علم المناخ» فسوف يتم إنشاء متغير جديد 
للوقت باسم gear‏ حيث يمكن قراءة هذا المتغير 'كتقويم سنوي من 
0 - إلى 1999( المتغير gisptemp‏ يتضمن درجات الحرارة التي تم 
sU‏ ها من بيانات الجليد .GISP2‏ المتغير shutemp‏ يحتوي على متوسط 
درجات الحرارة السنوية في نفس الموقع بجزيرة جرينلاند» والتي قام العلماء 
بقياسها خلال الفترة من 1999-1987 (در Shuman et al. al‏ 2001). 


.use C:\data\Greenland_temperature.dta, clear 
. describe 


-— 
=a 
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Contains data fror ©: MdataWGreeriand temperature.dta 


obs: 1,646 Greenland ice core temp 48,000 vears ago to 
1855 (Alley 2004) 
vars: 4 2 Jul 2012 06:11 
size: 26,336 
storage display vaiue 
variable name type format label variable label 
year float 0 'Calendar' year 
age float $8.0g Age, 1,000s of years before 1950 
gisptemp float %8.0g GISP2 ice core Central Greenland temp -48,000 to 
1855, C 
shutenp float $9.0g Shuman (2001) Summit temp 1987 to 1999, C 


Sorted by: year 
$ J )— درجات‎ GL thal الشكل )6.12( يعرض الرؤوس المدببة‎ 
هذه الرؤوس المدببة تم إنشاؤها من مستوى أساسي يساوي المتوسط‎ .GISP2 
للأمد الطويل مع درجات الحرارة التي تكون أعلى من المتوسط والتي تم‎ 
ودرجات الحرارة‎ cel jas Ande الإشارة إليها في الرسم باستخدام رؤوس‎ 
التي تكون أقل من المتوسط.والتي تم الإشارة إليها في الرسم برؤوس مدببة‎ 
زرقاء. وحيث إن البيانات أكثر توافرا للسنوات الأخيرة فإن المستوى‎ 
الأساسي المناسب لكامل السلسلة تم حسابه من متوسط فترات لاف السنين‎ 
بدلا من متوسط القياسات الفردية.‎ 
.gen millennium = int(year/1000) 


.-collapse (mean) gisptemp, by(millennium) 
.summ gisptemp 


Variable Obs Mean Std. Dev. Min Max 


gisptemp 50 -42.75702 6.798864 -51.48554 -30.02251 


.use C:\data\Greenland_temperature.dta, clear 
-graph twoway spike gisptemp year if gisptemp» 
-42.75702,base(-42.75702) lcolor(erose) 
|| spike gisptemp year if gisptemp«- - 
42.75702, 
base(-42.75702) 1color(eltblue) 
|| lowess gisptemp year, bwidth(.05) 
lwidth(medthick)lcolor(black) 
|| , ytitle("Central Greenland temperature, 
`=char (176) 'C")legend(off) - 
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الشكل )6.12( 


هذا الشكل البياني يعرض بوضوح عملية التحول من العصور الجليدية 
إلى الظروف الأكثر حرارة. درجات الحرارة في جرينلاند زادت بحوالي 20 
درجة مئوية» من أقل من 50- درجة مئوية إلى حوالي 30- درجة Ag gia‏ 
هذا التحول توقف مؤقتا حيث تمت العودة من جديد للعصور الجليدية في 
الفترة التي تسمى Younger Dryas‏ والتي حدثت في الفترة ما بين 12,900 
سنة تقريباً و11,500 سنة ماضية (التقويم السنوي 10,900- إلى 9,500- 
في الرسم البياني» الرأس المدبب المنخفض الأخير (« بداية Younger Ale,‏ 
leis JS Dryas‏ حدثت خلال عقود ALM‏ أو أقل من ذلك دافعا العديد من 
الدراسات لاختبار السبب المحتمل والإمكانية المستقبلية للتغير المناخي 
المفاجئ (انظر على سبيل المثال» دراسة White et al.‏ 2010(. 

المتوسط المتحرك أو تقنيات التمهيد غير الخطية التي تم توضيحها في 
e jall‏ السابق» تعمل بشكل جديد مع المشاهدات التي توجد بينها فترات زمنية 
متساوية» وعندما يحدث تباين بين هذه المشاهدات في فترات زمنية قصيرة؛ 
فإن قياسات الجليد في 61582 بها مسافات زمنية متفاوتة بين مشاهداتهاء مما 
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يجعل الفترة الزمنية بين مشاهداتها متفاوتة أكثر كلما تعمقنا iÍ‏ (أقدم) 
جاعلا طبقات الجليد أكثر كثافة. بالنسبة للسلاسل الزمنية مع فترات زمنية 
متفاوتة أو التي تم إجراء تمهيد لها خلال فترات زمنية طويلة أو التي لها 
انحدار لدالة تمهيد مثل المنحنى الذي يظهر في الشكل )6.12( فإنها تعر 
Doa)‏ عمليا. 


الشكل (7.12) يعرض أحدث جزء من البيانات التي تظهر في الشكل 
)6.12( واصفا درجات الحرارة GISP2‏ لفترة 11,000 سنة الماضية chii‏ 
الأشكال البيانية المشابهة لهذا الشكل البياني الذي يعرض الزمن بيانيا كان 
مصدرا أساسيا لعدم الوضوح. 
-graph twoway line gisptemp year if year» -‏ 
9000,1width(medthick)‏ 
xlabel(-9000(1000)2000, grid gmax gmin)‏ 
title("Greenland ice core only")‏ 
ytitle("Central Greenland temperature,‏ 
"schar(176)'C")‏ 
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الشكل )7.12( 
يمكننا أن نرى أن العديد من قيم التباين الخادعة في الشكل )7.12( حيث 
إن نقطة البيانات النهائية (الواقعية 1855( تم توصيفها بأنها "الحالية" وإذا 
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كانت هذه النقطة تمثل درجة الحرارة الواقعيةء فإننا قد نعتقد ob‏ جرينلاند 
مازالت أكثر برودة من المتوسط مقارنة ب 10,000 Aic‏ الماحسية: و ار 
الارتفاع الذي حدث أخيراً في درجات الحرارة كان غير ملحوظء وهذه هي 
النقطة التي حاول هذا الشكل إظهارها. البعض حاول استخدام طريقة الرسم 
البياني باستخدام خط أساسي مشابه لما قمنا بد في الشكل )6.12( ولكن تم 
تحديد 1855 على أنها نقطة النهاية للخط الأساسيء وذلك لجعل"البرد الآن" 
رسالة أكثر وضوحا. المتغيرات الأخرى تخفي حقيقة أن درجات الحرارة في 
جرينلاند ليست درجات الحرارة العالمية. 

في 1855 عموماء فإن درجات الحرارة في جرينلائد كانت da i‏ بدرجة 
بسيطة جدا من فترة برودة يُطلق عليها العصر الجليدي البسيط. درجات 
الحرارة الحديثة ASÍ‏ دفئاء وهذا أدى إلى انخفاض في AES‏ الغطاء الجليديء 
كما أدى إلى انخفاض في جليد البحر حول الساحل. حتى في فترة التسعينيات 
القياسات المباشرة من قمة الغطاء الجليدي توضح أن متوسط درجة الحرارة 
السنوية هو 29.26- درجة مئوية (دراسة Shuman et al.‏ 2001(« الشكل 
summ d ea E 3 (8.12)‏ 
درجات الحرارة ةما بين 199971987 يتم تركيبها كنقطة في الرسم 
البياني. هناك خطان من النصوص تم وضعهما في المركز عند محور y‏ عند 
درجة الحرارة 728.80( وعند التوصيف 0 بالمحور الأفقي × وبنفس 


لون العلامة نفسها. 
-graph twoway line gisptemp year,‏ 
lwidth (medthick)‏ 
scatter shutemp year, msymbol (S)‏ || 
mcolor (red)‏ 


|| if year >- 9000 ,xlabel (-9000 (1000) 2000, 
grid gmax gmin) 
title("Greenland ice core compared with 
recent") legend(off) 
ytitle("Central Greenland temperature, 
`=char (176) 'C") 


text(-28.80 1500 "1987٠ =char (150) '” "1999", 
color (red) ) - 
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الشكل )8.12( 


الشكل )8.12( يترك ائطباعاً مختلفاً عن الانطباع الذي يتركه الشكل 
)7.12(« بالرغم من أن بياناث الجليد المستخدمة في كلا الشكلين هي نفسها. 


Recent Climate Change : التغيرات الأخيرة $ اطناخ‎ 


سوف ننقل تركيزنا على وحدات القياس من آلاف السنوات إلى تلاثين 
سنة ماضية فقط. بقية هذا الفصل» سوف تركز على التغيرات التي حدثت في 
المناخ خلال السنوات الأخيرة. ملف البيانات Climate.dta‏ يحتوي على ثلاث 
سلاسل زمنية تقوم بتقدير درجات الحرارة العالمية الشهرية في الفترة من 
0 وحتى 2010( مع أربعة محركات أو أسباب محتملة لدرجات 
الحرارة» اثنان من مؤشرات درجات الحرارة يتم استخراجهما من قياسات 
درجة حرارة السطح (NCDC 5 NASA)‏ بينما المؤشر الثالث يقوم بتقدير 
درجات الحرارة من طبقة التربوسفير السفلية التي تم الحصول عليها مسن 
بيانات الأقمار الصناعية (UAH)‏ انظر إلى ملحق مصادر البيانات لمزيد من 
المعلومات عن كل هذه المتغيرات والتي تم جمعها معا من مصادر مختلفة. 


.use C:\data\Climate.dta, clear 
.describe 
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Contains data from C:\data\Climate.dta 


obs: 372 Global temperature & drivers 1980-2010 
vars: 11 2 Jul 2012 06:11 

size: 13,764 

storage display value 

variable name type format label variable label 
year int $9.0g Year 
month byte %9.0g Month 
myear int $&tmmCY Month, year 
ncdctemp float %9.0g NCDC global temp anomaly v.1901-2000, C 
nasatemp float $8.0g NASA global temp anomaly v.1951-1980, C 
uahtemp float %9.0g UAH global temp anomaly v.1981-2010, C 
aod float %8.0g Aerosol Optical Depth at 550nm 
tsil float $8.0g Total Solar Irradiance, W/m2 
mei float %9.0g Multivariate ENSO Index 
co2globe float $8.0g Global average marine surface CO2, ppm 
co2anom float $9.0g Global CC2 anomaly, ppm 





Sorted by: myear 


الفترة الزمنية 2010-1980 تم تغطيها بالبيانات الموجودة بالملف 
0 و هي محددة بالبيانات التي تم الحصول عليها للدراسة وتتضمن 
سلسلة زمنية لمتوسط مستويات ثاني أكسيد الكربون تم استخدامها هنا من a‏ 
سنة 1980» وبيانات العمق البصري للهبماء الجوي Aerosol Optical Depth‏ 
والتي تم تحديثها حتى سنة 2010. بيانات هذا الملف تم تحديدها كبيانات 
سلاسل زمنية باستخدام الأمر bius tsset‏ المتغير myear‏ كمتغير يمثل 
الزمن» وهو متغير يحتوي على بيانات شهرية تم تعريفها من خلال فصل 
المتغير month‏ والمتغير year‏ والتي كانت موجودة في البيانات الأصلية. 
وداخليا يقوم برنامج ستاتا بتعريف المتغيرات الشهرية كرقم لعدد الأشهر منذ 
يناير 1960 بنفس الطريقة يقة التي تم بها تعريف متغيرات التاريخ كرقم لعدد 
الأيام منذ 1 يناير 1960» هنا المتغير myear‏ له تنسيق YotmmCY‏ حتى يظهر 
Feb «1980 Jan Ul‏ 1980 وهكذا. إذا لم يتم القيام بإجراء هذا التنسيق TARR‏ فإن 
إنشاء هذا المتغير الشهريء وتحديد البيانات كبيانات سلاسل زمنية باد._تخدام 


Gay هي خطوات ضرورية للقيام بأي تحليل‎ stsset الأمر‎ 
gen myear - ym(year, month) 
-format myear %tmmCy 


label variable myear "Month, year' 
.tsset myear 
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في ورقة بحثية تم استخدامها كمرجع من قبل كثير من الدراسات. 
قام كل من Rahmstorf 5 Foster‏ 2011 (بناءً على عمل سابق من قبل 
Lean and Rind,‏ 2008( بتحليل درجات حرارة مشابهة» ومتغيرات قيادية 
للكشف عن "الإشارات الحقيفية لظاهرة الاحتباس الحراري e" ald‏ التحليل 
الذي قاموا به أكثر دقة من الأمثلة البسيطة الموجودة في هذا الفصل مع 
وصولنا لنتائج متشابهة في agal‏ ` 

الشكل (9.12) يعرض درجات الحرارة العالمية الشاذة حسب مؤشر مركز 
بيانات المناخ الوطني (NCDC)‏ والتي تظهر في المتغير aicdctemp.‏ درجات 
الحرارة الشاذة من محطة أرصاد جوية تمثل انحرافات عن درجة الحرارة 
المشاهدة من متوسط درجات الحرارة في الأمد الطؤيل في محطة الأرصاد تلك 
درجات الحرارة الشاذة العالمية بالتالي تم حسابها من متوسط موزون للعديد من 
درجات الحرارة الشاذة في العديد من محطات الأرصاد حول العالم؛ الخط 
الرمادي عند درجة الحرارة صفر يمثل متوسط القرن العشرين. 

-tsline ncdctemp, lw(medthick) 
ytitle("Global temperature anomaly vs. 
1901'-char(150)'2000, 
`=char (176) 'C", size(medsmall)) 
yline(0, lcolor(gs12) lwidth(thick)) 


xtitle("") 
xlabel(, grid gmin gmax) 
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كل الأشهر ماعدا شهرين في الشكل )9.12( لها درجات حرارة أعلى 
من متوسط درجات الحرارة في القرن العشرين. ظاهرة الاحتباس الحراري 
شهدت اغ ككز ا مله ت ا ي الفترة التي تم تمثيلها 
Lily‏ في هذا الشكل» والنقطة المركزية العليا في هذا الشكل وهو الشهر الذي 
شهد lel‏ درجات حرارة Galle‏ في فبراير 1998 لم يتم تجاوزها (ثم تم 
الوصول إليها تقريبا) حتى يناير 2007. كلتا النقطتين أكثرمن الانحرافات 
المعيارية للاثنين» وأعلى من أي شهر قبل سنة 1980 في بيانات NCDC‏ 
والتي تعود إلى سنة 1880 (انظر الشكل 1.2 في الفصل الثاني)» La pac‏ 
فإن درجات الحرارة المرتفعة خلال فترة زمنية كبيرة من سنة 1998 مع 
درجات الحرارة المنخفضة خلال العقد الماضي تشكل teca teal‏ نان 
الاحتباس الحراري قد يكون قد توقف Wigs‏ خلال العقد الماضي. الجزء 
الأخير من هذا الفصلء يقوم بتطبيق نماذج السلاسل الزمنية لاختبار 
التفسيرات المحتملة. 

إذا كانت هناك أسباب تنظيمية» فإنها فد توجد بين المتغيرات الأخرى 
فى بيانات .Climate.dta‏ هذه تتضمن أربعة عوامل تم تحديدها بواسطة علماء 
الطبيعة كعوامل مهمة تسبب أو A‏ على تباين درجة حرارة الهواء. وحيث 
إن عدم صفاء الجو والتي تقاس هنا بواسطة العمق البصري للهباء الجوي 
(AOD)‏ عند طول موجي 550nm‏ وهذا يعكس تأثير ثورات البراكين ills‏ 
تجعل درجة حرارة السطح nagas‏ وذلك من خلال إضافة أشعة ضوء 
الشمس التي تحجزه البراكين المرتفعة في الجو (دراسة Sato et al.‏ 1993( 
الخفوت الشمسي الكلي Total Solar Irradiance (TSI)‏ يتضمن قياسات تعتمد 
على الأقمار الصناعية للكمية المتذبذبة من أشعة الشمس تقس بالوات لكل 
متر مربع) الذي يسطع عند الطبقات العلوية للغلاف الجوي للأرض (دراسة 
Frohlich‏ 2006(« وحدوث ظاهرة إلنينو/ التذبذب الجنوبي (ENSO)‏ يمكن أن 
تكون لها تأثيرات جوهرية على درجات حرارة الهواء العالميةء كما أن 
الهواء الساخن الذي يحدث أثناء تغيرات الجو ويساهم في تسخين سطح الماء 
في مركز وشرق المنطقة الاستوائية بالمحيط الهادئ (إلنينو (El Nino‏ أو 
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درجات الهواء الباردء والذي يقوم بدفع. مياه المحيط العميقة إلى السطح (لا 
نينا (La Nina‏ بعض مؤشرات ENSO‏ تعرف من خلال درجات حرارة سطح 
البحرء وتؤدي إلى إنشاء تيارات مداريةء وتستخدم هذه لاحقا لتفسير درجة 
الحرارة. ومن ناحية أخرى» فإن مؤشر ENSO‏ المتعدد (MEI)‏ يتم تعريفه من 
خلال المكوّن الرئيس الأول للمتغيرات 6 التي تم مشاهدتها في a ihid‏ 
EEE atlas p pia ape s hg ted loea: bal‏ 
الطولية والعرضية للرياح السطحية؛ درجة حرارة سطح البحرء درجة 
حرارة هواء السطح» والجزء المُعيَّم الكلي من السماء؛ قيم MEI‏ التي تكون 
أعلى من الصفر بدرجة جوهرية تشير إلى حالة إلنينوء بينما القيم التي تكون 
أقل من الصفر تشير إلى Uy‏ (دراسة Wolter and Timlin‏ 1998)؛ المحرك 
الرابع في هذه البيانات هو المتوسط العالمي لتركيز ثاني أكسيد الكربون 
لسطح البحرء ol,‏ بأجزاء من المليون بناءً على قياسات من شبكة المواقع 
الجغرافية المختلفة (دراسة Masarie and Tans‏ 1995(« المتغير co2globe‏ 
يعطي التركيز الفعلي لثاني أكسيد الكربونء والمتغير co2anom‏ يقوم بإزالة 
التباينات الموسميةء وذلك من خلال طرحها من كل قيمة للمتوسط العالمي 
لذلك الشهر في الفترة 2010-1980. 


الشكل (10.12) يقوم بدمج الرسومات البيانية للزمن لأربع سلاسل 
رئيسة خلال نفس السنوات التي تم تمثيلها في الشكل )9.12( الرسم البياني 
ل AOD‏ في أعلى اليسار له نمط مثير للانتباه» وتم التأثير عليه بواسطة 
اثنتين من الثورات البركانية الكبيرة: الأولى الشيكنو El Chichón‏ في المكسيك 
في نهاية مارس 1982( والثانية بجبل بيناتوبو Mount Pinatubo‏ في الفلبين 
في يونيو 91 .. كما أن TSI‏ يتحرك بشكل متسلسل» ولكن هذا التسلسل 

تمت مقاطعته فجأة بواسطة رؤوس مدببة مرتفعة ومنخفضة. ثم كانت الفترة 
الأخيرة مستقرة إلى حد كبير. بالنسبة ل MEI‏ فلم يكن متسلسلاً بالرغم من 
مظهره المتذبذب مع فترات غير منتظمة بين الأوضاع الإيجابية والنسلبية؛ 
عدم الانتظام واحتمال حصول تغيرات سريعة يجعل إلينيو ولانينا Bla al‏ 
صعبة التوقع» بالرغم من تأثيراتها الكبيرة على الناس» مما يجعل التنبؤ بها 
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هدف مهم جدا. كما أن تركيز ثاني أكسيد الكربون كان سهل cad sill‏ لأنه في 
ارتفاع مستمر بزيادة قدرها 5 بليون طن. Cus‏ إنه 5 313 ol‏ الهواء الجوي 
كل سنة نتيجة أنشطة بشرية. 


Aerosol Optical Depth Total Solar Irradiance 


TSL. W/m 
c, 1365 1365.5 1366 1366.5 1367 
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(10.12) الشكل‎ 
آخر جزء في هذا الفصلء قام باختبار كيف أن هذه المتغيرات الأربعة‎ 
معا تشرح التغيرات الأخيرة في درجات الحرارة» ونتابع هذا التحليل في‎ 
الجزء التالي الذي سوف يتطرق إلى المفاهيم الأساسية والأدوات.‎ 
: التباطن والسوايف والفروقات‎ Ol 


Lags, Leads and Differences 





تحليل السلاسل الزمنية في العادة» يتضمن متغيرات لها فترات تباطؤ أو 
قيم من فترات ماضية. فترات التباطؤ يمكن تحديدها بواسطة الأقواس. فمثلا 
الأمر أدناه يقوم بإنشاء متغير جديد باسم 1 mei‏ وهو يساوي القيم السابقة 
لمؤشر 8250 التراكمي: 


generate mei 1 = mei[ n-1] 
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أو هناك طريقة أخرى يمكننا استخدامها للقيام بنفس العملية» وذلك من 

خلال الأمر tsset‏ مع المحدد .1 (فترة التباطؤ). فاستخدام محددات فترات 

التباطؤ أفضل من استخدام طريقة الأقواس. والشيء المهم laa‏ أن اس تخدام 

محدد فترة التباطؤ يأخذ في الاعتبار البيانات الطولية cPanel Data‏ الأمر أدناه 
يقوم بإنشاء قيم تباطؤ لمدة شهر 1- و2- للمتغير mei‏ 

.generate mei 1 > L1.mei 

.label variable mei 1 "MEI 1-month lag 

generate mei 2 = L2.mei 

.label variable mei 2 "MEI 2-month lag 

.list year month mei mei 1 mei 2 in -5/1 


year month 


368. 
369. 
370. 
371. 
372. 





كما يمكننا الحصول على نفس القائمة» وذلك من خلال إنشاء متغيرات 
جديدة عن طريق طباعة الأمر: 
.list year month mei L1.mei L2.mei in -5/1‏ 


المحدد .1 هو أحد الأدوات التي تسهل العمل مع بيانات السلاسل 
الزمنيةء حيث هناك محددات أخرى هي F.‏ (لاحقة)» D.‏ (الفرق)» S.‏ (الفرق 
«(pau gal‏ هذه المحددات يمكن طباعتها كحرف صغير أو كبيرء فمثلا 
F2.mei‏ هو نفسهة f2.mei‏ 


Time Series Operators : محددات السلاسل الزمنية‎ 





5 يعني نفس الشيء).‎ LI.) y فترة تباطؤ‎ L. 
Ll. وهكذاء .(1)1/4 تعني فترات تباطؤ من‎ L3. (وبالمثل‎ y; فترتا تباطؤ‎ L2. 
(L4. وحتى‎ 
تعني نفسي الشيء).‎ FL) فترة لاحقة ,بير‎ ۴. 
فترتان لاحقتان,بربر (وبالمثل .53 وهكذا).‎ 2. 
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ا o ou cT‏ هضع مع برنامج ستانا. 

الفرق بين الفترة الحالية والفترة السابقة ;»7 DI.) y‏ تعني نفس الشيء). 

D2.‏ فرق الدرجة الثانية )»0407 - 0r- ye)‏ (وبالمثل .3« وهكذا). 

(D. الفرق الموسمي ,.بر- ,بر (وهو نفسه الفرق الناتج من‎ S. 

S2.‏ الفرق الموسمي الثاني 2 (وبالمثل .53 وهكذا). 

في حالة الفروقات panu gal)‏ فإن المحدد 2 لا يعني الاختلاف الثاني 
عشرء ولكنه الاختلاف الأول عند فترة تباطو 12 . فعلى سبيل المثالء إذا 
كانت لدينا قيم فعلية لثاني أكسيد الكربون CO;‏ العالمية فقط بدلا من القيم 
الشاذة» فإنه بالإمكان أن نرى نمطا موسمياً واضحاً منخفضاً في أغسطس 
وسبتمبرء ولبعض الأسباب قد نحتاج إلى حساب 512.602 والذي قد يكون هو 
الاختلافات بين يناير 1980 co2‏ ويناير 1981 «co2‏ وكذلك بين فبراير 
co2 1980‏ وفبراير 1981 co2‏ وهكذا. 

محددات فترات التباطؤ يمكن أن تظهر مباشرة في أغلب أوامر التحليل 
التي تتضمن بيانات -tsset‏ المثال أدناه يقوم بحساب انحدار درجات الحرارة 
العالمية (nedetemp)‏ على مؤشر العمق البصري للشهر الماضي (aod)‏ والذي 
يفترض ils‏ أن يزيد تأثير البرودة. الانحدار تم حسابه بدون الحاجة إلى 


إنشاء أي متغیر ات تباطو جديدة. 
.regress ncdctemp L1.aod‏ 

























Source B Number of obs - 371 
Ft. 1, 369) = 54.92 

Model 1.7221338 1 1.7221338 Prob > F = 0.0000 
Residual 11.5699674 369 .031354925 R-squared = 0.1296 
Adj R-squared = 0.1272 

13.2921012 370 .035924598 Root MSE = .17707 











ncdctemp Coef. Std. Err. t P>|t| (95% Conf. Interval] 








-2.313292 





-3121404 





-7.41 0.000 -2.92709 -1.699495 


_cons .4361341 .0105842 41.21 0.060 .4153213 .456947 
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وكما هو ab gia‏ فإن متغير god‏ له تأثير سالب على درجات الحرارة 
العالمية» والنموذج الذي تم تقديره يتضمن درجات حرارة شهرية كدالة لقيم 
aod‏ للشهر الماضي: 

ncdctemp, = 0.436 - 1304‏ المتوقعة 

معامل المتغير المتباطئ )2.313-(204 يظهر ذو معنوية إحصائية )0.000 (p=‏ 
ولكن الأخطاء المعيازية:وافتا نات الاتكدان فد تكون اة وكيا دز 
معتاد مع أي نموذج OLS‏ فإنه يعتمد على فرضية أن أخطاء المشاهدات المتعاقبة 
هي أخطاء مستقلة أو غير مترابطة مع بعضهاء الأخطاء المترابطة تحدث في 
العادة في تحليل السلاسل الزمنية. ولذلك فإننا نقوم بشكل روتيني باختبار وجودها 
كما سوف يتم فعله في الجزء التالي. الأخطاء المعيارية وفترات الثقة واختبارات 
الانحدار 5 التي تتضمن سلاسل زمنية يجب النظر إليها بنوع مز الشك مالم 
تظهر الاختبارات بأنه ليس هناك دليل على وجود الأخطاء المترابطة. 

بالرغم من احتمالية أن الأخطاء المترابطة تجعل اختبارات F‏ وء من هذا 
الانحدار غير موثوقةء فإن معادلة الانحدار نفسها يمكن أن تعطينا وصفاً 
صحيحا للمربعات الصغرى للبيانات» الشكل )11.12( يعرض القيم المتوقعة 
مع درجات الحرارة salad)‏ ثورة بركان Pinatubo‏ الضخمة في سبنة 
1 توقعت انخفاضاً كبيرًا في درجات الحرارة والتي تظهر في بيانات 
درجات الحرارة. ومن الواضح أن هناك الكثير مع ثورة بركانين كان لها 
تأثيرها على المناخ العالمي. 
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سوف نستمر في التحليل الوصفيء حيث يمكننا اكتشاف ما إذا كانت 
محركات درجات الحرارة المقترحة في هذه البيانات ت تتطور حتى تتناسب مع 
درجات الحرارة المشاهدة. . وبتضمين أشعة الشمس مع فترة ة تباطو كمتغير 
تنبؤي cob‏ فإن ذلك يزيد من قيمة ,۸ زيادة بسيطة من 0.127 إلى 60.144 
ويظهر معامل متغير أشعة الشمس التباطؤية سالباء وهذا ليس له أي معنسى 


.regress ncdctemp L1.aod L1.tsil 
























Source Number of obs - 371 
F( 2, 368) = 32.22 

Model 1.98067563 2 .990337816 Prob < م‎ = 0.0000 
Residual 11.3114256 368 .03073757 R-squared - 0.1490 
Adj R-squared = 0.1444 

13.2921012 370 .035924598 Root MSE = .17532 












ncdctemp Coef. Std. Err. t p(t] [958 Conf. Interval] 





-2.172641 


۰ 
.3128342 . -2.787808 -1.557474 


tsil 
L1. -.0598584 -0206393 -2.90 0.004 -.1004441 -.0192727 
_cons 82.19402 28.19026 2.92 0.004 26.75982 137.6282 





إضافة متغير تنبؤي تباطؤي ثالث وهو مؤشر ENSO‏ المتعدد يزيد من 
قدرة النموذج على شرح التباين 0.201 = oR,‏ معامل المتغير LLmei‏ موجب 
ويُفترض أن يُعطي hab‏ حرارياً معروفاً لإلينوي. سوف نرى أيضا معامل 
سالب غير معقول للمتغير “Li tsi]‏ 


.regress ncdctemp 1:1 . 3203 1:1 . 2531 L1.mei 
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ل سي سا ا يي مت 




















Source Number of obs - 371 
Fil 3, 367) = 32.00 

Model 2.75629902 3 918766339 Prob > F = 0.0000 
Residual 10.5358022 367 .028707908 R-squared = 0.2074 
- Adj R-squared = 0.2009 

Total 13.2921012 370 .035924598 Root MSE = ,16943 















ncdctemp Coef. Std. Err. t P»[t| [95$ Conf. Interval] 









L1. -2.949131 .3372229 -8.75 0.000 -3.612262 -2.285999 

tsil 

L1. -.05509 .0199673 -2.76 0.006 -.0943546 -.0158253 

mei f 

L1. .0524371 ` .0100882 5.20 0.000 .0325991 .072275 
_cons 75.67739 27.27247 2.77 0.006 22.04748 129.3073 


التطور الملحوظ في ,۸ حدث عندما قمنا بإضافة القيم الشاذة ال CO,‏ 
إلى المتغيرات التنبؤية. هذه المتغيرات الأربعة معاً تشرح حوالي 9672.7 
من التباين في درجات.الحرارة الشهرية. القيم الشاذة ل CO,‏ لها حتى الآن 
أقوى تأثير في الاتجاه الموجب كما هو متوقع من طبيعة الغازات المنسببة 
للاحتباس الحراري. فعندما نتحكم في «CO;‏ فإن معامل أشعة ضوء الشمس 
تصبح موجبة Lad‏ 


.regress ncdctemp L1.aod L1.tsil L1.mei 
L1.co2anom 


Source ss d£ MS Number of obs 





3 371 

F( 4, 366) - 247.57 

Model 9.70518563 4 2.42629641 Prob » F - 0.0000 
Residual 3.58691559 366 -009800316 R-squared = 0.7301 
Adj R-squared = 0.7272 

Total 13.2921012 370 .035924598 Root MSE = .099 
















ncdctemp 


(95% Conf. Interval) 





L1. -1.535808 -2040555 -7.53 0.000 -1.937077 -1.13454 

tsil 

L1. . 0882862 .012849 6.87 0.000 .0630189 .1135534 

mei 7 ١ 

L1. .0689124 .0059267 11.63 0.000 .0572578 .0805671 
co2anorm 

L1. -0109831 -0004125 26.63 0.000 .010172 -0117942 


—cons -120.1742 17.55028 






-154.6862 





-85.66217 
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الشكل )12.12( يعرض تطورا I4‏ للنماذج الأربعة. القيم المتوقعة في 
في الجانب الأسفل الأيمن وهي التي ظهرت Sly‏ على انحدار كل المتغيرات 
الأربعة الرئيسة يعرض درجات الحرارة المشاهدة بطريقة (A ii‏ حيث 
يتضمن cali‏ مثل ay yal‏ بعد ثوزة :9 days p Li Jy «Pinatubo GIS‏ 
الحرارة خلال فترة "إلنينو الفائق" لسنة 1998 والمسار المتحرك للعقد 
الماضي» والذي انخفضت درجة حرارته بسبب انخفاض أشعة الشمس 
والانخفاض الكبير إلى سالب CENSO‏ التناسب بين درجات الحرارة المتوقعة 
والمشاهدة واضح جداء لان التوقعات cela‏ من نموذج بسيط جدا جميع 
تأثيراته كانت خطية وكانت متغيراته مع فترة تباطؤ لشهر واحد فقط. 


Volcandes Volcanoes, solar 
o © 
o © 
< * 
e Di 
o o 
b ~ 


Jan1980 Jani990 Jan2000 Jan2010 ^ Jan1980 Jan1990 Jan2000 Jan2010 


Volcanoes, solar, ENSO` Volcanoes, solar, ENSO, CO, 


D 
«D 
"T 
N 
2 


0 2 4 6 8 


Global temperature anomaly vs. 1901-2000. °C 
2 


Jan198û Jan1980 Jan2000 Jan2010 Jan1980 Janieso .Jan2000 Jan2010 
Hamilton (2012) Statistics with Stata : 
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نماذج المناخ العالمي والتي تعتمد على الطبيعة بدلا من الإحصاء 
تتضمن العديد من المتغيرات» والعديد من التعقيدات الجغرافية المتنوعة والتي 
قد تحتاج إلى أسابيع ina 3 gals E‏ دات CS‏ ضخمة Nae‏ 
النتائج المعروضية في Aa‏ (12.12) توضح بأن مثل هذا النموذج البسيط 
بعمل بقدر إمكاناته وفي: ضر ذل محدداته. أحد فده المحددات هو محدد 
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إحصائي: Gus‏ إن الأخطاء المعيارية ل OLS‏ متحيّزة: واختبارات F‏ وا 

تكون غير صالحة في حالة حدوث ترابط بين هذه الأخطاء. أحد الفحوصات 

البسيطة للأخطاء المترابطة يُسمى اختبار دربن واتسون Durbin-Watson‏ 
والذي يمكن استخدامه بعد أي انحدار. 

.estat dwatson 

Durbin-Watson d-statistic(5, 371)= 1.131453 


كتب الإحصاء تحتوي على جداول للقيم الحرجة لاختبار دربن واتسون» 
وإذا أخذنا 5 معلمات 38s‏ $ )4 متغيرات تنبؤية وتقاطع (y‏ و371 مشاهدة 
فإن القيم الحرجة تقريبا هي 1.59 = dh‏ و 1.76 - edu‏ إحصائية الاختبار تحت 
59 = 4 تقود إلى رفض فرضية العدم» Gh‏ هناك ارتباطا ذاتيا موجبا (فترة 
تباطؤ 1) من الدرجة الأولى. ولأن الإحصائية المحسوبة 1.131 أقل من 
9 = ه» Lila‏ يجب أن نرفض فرضية العدم ونستنتج بدلا من ذلك أن هناك 
ارتباطا ذاتيا موجبا من الدرجة الأولى. هذه النتيجة تؤكد الشكوك الأولية 
حول مدى صلاحية اختبارات في نماذج Gla jal OLS‏ الحرارة. 


لو كانت الإحصائية المحسوبة أكبر من 1.76 dy‏ لفشلنا في رفض 
فرضية العدم» ولم يكن لدينا أي دليل على أن الارتباط الذاتي ذو معنوية. 
إحصائيات دربن واتسون المحسوبة بين .4 و dy‏ فهذا يعني أننا لانستطيع 
رفض أو قبول فرضية العدم “Hy‏ 

إحصائية دربن واتسون تختبر الارتباط الذاتي من الدرجة الأولى. 
وتأخذ في الاعتبار الفرضيات البديلة الإيجابية فقط. وفي الواقع العملي» فإن 
الارتباط الذاتي يمكن أن يكون سالباً أو chase‏ ويمكن أن يحدث عند فترات 
تباطؤ أخرى غير 1. الجزء التالي يعرض بشكل أكثر تفصيلا أدوات 
iSc‏ العامة 
cu dani‏ للارئباط : Correlograms‏ 





مُعاملات الارتباط الذاتي تقدّر الارتباط بين متغير ما ونفسه عند فترات 
تباطو معينةء فمثلاً الارتباط الذاتي من الدرجة الأولى هو الارتباط بين بر 
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وس Ul‏ الدرجة TER‏ تشير إلى الارتباط بين [y, , yo]‏ وهكذا. التمثيل 
البياني للارتباط يعرض تمثيلاً بيانياً للارتباط مقابل فترة التباطؤ. 

الأمر corrgram‏ يعطي Us Lily Jia‏ للارتباط مع المعلومات ذات 
العلاقة, أقصى عدد لفترات التباطؤ التي يتم عرضها يمكن أن يكون game‏ | 
نتيجة البيانات» وذلك باستخدام الخيار cmatsize‏ أو بعض الأرقام المنخفضة 
العشوائية» والتي يتم تحديدها باستخدام الخيار :lags()‏ 


.Corrgram mei, lags(13) 


-1 0 1-1 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] 
1 0.9473 0.9569 336.5 0.0000 
2 0.8582 -0.4181 613.45 0.0000 
3 0.7532 -0.0631 827.33 0.0000 
4 0.6350 -0.1578 979.77 0.0000 
5 0.5167 0.0033 1081 0.0000 
6 0.4036 -0.0680 1142.9 0.0000 
7 0.2983 -0.0299 1176.8 0.0000 
8 0.2060 -0.0235 1193 0.0000 
9 0.1224 -0.0393 1198.8 0.0000 
10 0.0499 -0.0185 1199.7 0.0000 
11 -0.0140 -0.0359 1199.8 0.0000 
12 -0.0723 -0.0340 1201.8 0.0000 
13 -0.1243 -0.0456 1207.8 0.0000 


فترات التباطؤ تظهر في الجانب الأيسر من الجدول يليها قيم الارتباط 
الذاتي (AC)‏ والارتباط الذاتي الجزئي Std «(PAC)‏ الارتباط بين mei,‏ 
mei, 5‏ هو 0.8582 بينما الارتباط الذاتي الجزئي (المعدل لفترة تباطؤ 1( 
هو 70.4181( إحصائيات © (إحصائية (Ljung-Box‏ تختبر سلسلة من 
فرضيات العدم التي بها الارتباطات الذاتية تتضمن فترة تباطؤ تساوي 
صفراء وحيث إن eS‏ الاحتمال p-values‏ التي نراها هنا كلها صغيرة EY‏ 
Lule Gad‏ رفض فرضيات العدم» ونستنتج من ذلك بأن مؤشر ENSO‏ 
التراكمي (mei)‏ يوضح ils‏ ذاتياً ذا معنوية» وإذا وجدنا بأنه لا توجد أي 
قيمة احتمال لإحصائية Q‏ أقل 0.05 فإنه يمكننا الاستنتاج بأن السلسلة كانت 
ذات ضجة 4 بيضاء white noise‏ مع ارتباط ذاتي ليس ذا معنوية. 
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في الجانب الأيمن لمخرجات جدول الأمر corrgram‏ حيث إن هذا الجدول 
تميّز بخطوط بيانية توضح الارتباطات الذاتية» والارتباطات الذاتية الجزئية» 
فحص مثل هذه الخطوط البيانية يلعب دور في اختيار نماذج السلاسل الزمنية: 
فالتمثيل البياني للارتباط الذاتي يمكن الحصول عليه من خلال الأمر rac‏ 

.ac mei, lags(25) 

الشكل )13.12( يتضمن منطقة مظللة مع نقطة تمركز مع فترة ثقة 
5 الارتباطات خار ج منطقة الثقة ذات معنوية إحصائيةء الخيار lags(25)‏ 
يوسّع هذا الشكل البياني إلى فترة تباطؤ 25 شهرًا eer‏ أن الارتباطات 
الذاتية للمتغير mei‏ أصبحت سالبة بعد حوالى 12 شهراء هذا lai‏ يعكس 
خاصية شبه متذبذبة ل Cus ENSO‏ إن الفترات العليا تميل لتكون متبوعة 
بفترات أقل وهكذا. 


Autocorrelations of mei 





Bartlett's formula for MA(q) 95% confidence bands 
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وبالمثلء فإن الأمر pac‏ يقوم بإنشاء رسم بياني للارتباطات الذاتية 
الجزئية في الشكل T‏ فترات الثقة التقريبية تقوم bly‏ على تقديرات 


الخطأ المعياري — T‏ الارتباطات الذاتية الجزئية للمتغير mei‏ تختلف 


عن الارتباطات «All‏ حيث إنها تقطع calci‏ القيم التي اش ذات معنوية 


بعد فترة تباطؤ تساوي شهرين. 
.pac mei, lags(25)‏ 
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95% Confidence bands (se = 1/sart(n)] 
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التمثيل البياني المتقاطع للارتباط الذاتي يساعد في اكتشاف العلاقة بين 
اثنين من السلاسل الزمنية الشكل )15.12( يعرض SIE‏ بيانياً متقاطعا 
t ead‏ الكلي «mei 9 usn m E‏ التمثيل البياني sae amt‏ تباط 


يصبح أكثر قوة تدر 


E عابو‎ EETA are 
.xcorr tsil mei, lags(25) xline(0) xlabel(- 


25(5)25) 


1.00 


y eee en dC 
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التمثيل البياني المتقاطع للارتباط الذاتي هو طريقة سهلة las‏ للقراءة إذا 
قمنا بوضع قائمة للمدخلات أو أول متغير مستقل في الأمر xcorr‏ 
والمخرجات أو ثاني متغير تابع كما تم القيام به في الشكل )15.12( يليها 
فترات تباطؤ موجبة تشير إلى ارتباطات بين مدخلات عند الزمن | 
ومخرجات عند الزمن 1+» 2+: وهكذا. في هذا الشكل نرى بعض الارتباط 
بيخ ENSO Alloy Quadll Al‏ حول is cuiua‏ ومعتدلا بغات: وهذا يودي 
إلى تأخير تأثير الشمس على CENSO‏ ليس هناك ارتباط بين أشعة الشمس 
وحالة ENSO‏ خلال سنتين سابقتين ولا يعطي (بدرجة معقولة) أي سبب 
للتفكير ENSO ob‏ يؤثر على الشمس. 

DEn‏ الارتباط المتقاطع؛ والإصدار النصي للتمثيل البياني للارتباط 
المتقاطع يمكن الحصول عليه باستخدام الخيار table‏ 


.xcorr tsil mei, lags(13) table 


-1 0 1 
LAG CORR [Cross-correlation] 
-13 -0.0308 
-12 -0.0370 
-11 -0.0434 
-10 -0.0372 
-9 -0.0275 
-8 -0.0209 
-7 -0.0062 
-6 0.0038 
-5 0.0093 
-4 0.0156 
-3 0.0262 
-2 0.0343 
-1 0.0355 
0 0.0326 
1 0.0340 
2 0.0427 
3 0.0466 
4 0.0468 
5 » 0.0441 
6 ˆ 0.0476 
7 0.0558 
B 0.0721 
9 0.0849 
10 0.0930 
11 0.1008 
12 0.1041 
13 0.1142 
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بقية هذا الفصل تتحدث عما بعد الارتباط لتتناول نماذج زمنية أكثر. 
مادخ ARIMA Models : (ARIMA)‏ 

نماذج المتوسط المتحرك للانحدار الذاتي التكاملي Autoregressive‏ 
(ARIMA) integrated moving average‏ يمكن تقديرها من خلال الأمر «arima‏ 
هذا الأمر يتضمن الانحدار الذاتي (AR)‏ أو المتوسط المتحرك (MA)‏ أو 
نماذج LARIMA‏ كما يمكن تقدير النماذج الهيكلية التي تتضمن متغيرا تنبؤيا 
أو أكثرء كما تتضمن أخطاء «ARIMA‏ وهي تسمى نماذج ARMAX‏ وتكون 

Y= XJ+ pı [1.12] 

حيث إن y,‏ موجه قيم المتغير التابع عند الزمن x, d‏ مصفوفة قيم 
المتغيرات التنبؤية الخارجية (وتتضمن ¿ في العادة ثابت) وم هو موجه 
الأخطاء Js’‏ الأشياء cus AMI‏ هذه الأخطاء يمكن أن تكون انحدارا ذاتيا أو 
متو Ds sna Doa‏ أي درجةء Mud‏ أخطاء ARMA(1,1)‏ هي: 

A47pu,t0e,,-e, [2.12]‏ 
المتوسط المتحرك من الدرجة الأولى» Bae,‏ أخطاء الضجة البيضاء white‏ 
noise‏ وهي غير مترابطة arima Aó] gic g‏ تناسب النماذج البسيطة مثل 
الحالة الخاصة في المعادلة [1.12] و[2.12] مع ثابت (fo)‏ يقوم باستبدال 
الصيغة الهيكلية x‏ وبالتالي فإن نموذج (88314)1,1 البسيط يصبح: 

Ye 7 fotu 

= f, = لمم‎ *8e,, + €, [3.12] 

بعض المصادر تعرض أشكالاً بديلة» ففي حالة ARMA(I,1)‏ فإنها تعرض بر 
كدالة لقيمة y‏ السابقة Qa)‏ وتعرض (e)‏ وأخطاء تباطؤية )€( 

y»-7a*g,,*0e,,-e, [4.12] 

وبما أن النموذج الهيكلى المبسط يحتوي ,بر + Bo‏ = ,بر فإن المعادلة ]3.12[ 
i)‏ لمستخدمةمن قبل برنامج ستاتا) تعادل المعادلة [4.12] كجزء من إعادة 
قياس الثابت م6(م- 1( = ». 
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وباستخدام الأمر sarima‏ فإن نموذج ARMA(LI)‏ يمكن تبسيطه بإحدى 
الطريقتين التاليتين: 
.arima y, ar(1) ma(1)‏ 
أو: 
.arima y, arima(1,0,1)‏ 
الحرف i‏ في الأمر 3 هو اختصار لكلمة 'متكامل" “integrated”‏ 
والتي تشير إلى النماذج التي تتضمن اختلافات؛ ولصياغة نموذج 
ARIMA(2,1,1)‏ نقوم باستخدام: 
.arima y, arima(2,1,1)‏ 
وهذا يكافئ: | 
.arima D.y, ar(1/2) ma(1)‏ 
Gb bay‏ الخيار arimaQ‏ هو الرقم المٌُعطى لصيغة الانحدار AM‏ أو 
المتوسط المتحرك الذي يحدد كل فترات التباطؤء والتي تتضمن ذلك cab I‏ 
إذن فإن الرقم "2" يعني فترتي تباطؤ 1 و2. وعند استخدام الخيارات ma()‏ 
أو aro‏ فإن العدد المستخدم يقوم بتحديد فترة تباطؤ معينة فقط. إذن فإن الرقم 
"2" يعني فترة تباطؤ تساوي 2 فقط. الأمران أعلاه يحددان نموذجا به 
الاختلافات الأولى للمتغير التابع (,.بر- ,بن هو دالة للاختلافات الأولى مع 
فترة تباطؤ واحدة وفترتي تباطؤ سابقة (وير- Ja‏ و (yao ys‏ وكذلك 
للأخطاء الحالية والسابقة ),€ و,,ء). 


لتقدير نموذج هيكلي والذي به «رتعتمد على متغيرين تنبؤيين x‏ (قيم 
حالية وتباطؤية (xerg x,‏ و« (القيم الحالية فقط (w,‏ مع أخطاء ARIMA(1,0,3)‏ 
Las‏ الأخطاء ARIMA(1,0,1)‏ الموسمية المضاعفة والتي تعود إلى 12 فترة 
زمنية Cus)‏ إنها تكون مناسبة للبيانات الشهرية خلال عدد من السنوات) 
والأمر المناسب للقيام بذلك قد يأخذ الصيغة التالية: 
.arima y x L.x w, arima(1,0,3) sarima(1,0,1,12)‏ 

وفي سياق الاقتصد القياسني» فإن هذا يتوافق مع نموذج 
ARIMA(1,0,3)x(1,0,1);‏ 

السلسلة الزمنية y‏ تعتبر مستقرة إذا كان متوسطها وتباينها لم يتغيرا مع 
الوقت» وإذا كان التغاير المصاحب بين بر yg‏ يعتمد فقط على فترة تباطؤ u‏ 
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وليس على قيم معينة ل » صياغة نماذج ARIMA‏ تفترض أن السلسلة 
الزمنية مستقرة أو يمكن جعلها مستقرة من خلال طرق مناسبة للتحويل أو 
القروقات: ode pond Liha‏ الفركدية E gs‏ فحضن "CUERO‏ 
الزمن من خلال مستوى التباين. رأينا Gla‏ أن درجات الحرارة العالمية مثلاً 
شهدت اتجاها معينا يوضح بأنها غير مستقرة. 
الاختبارات الإحصائية الرسمية ل "جذور الوحدة" غير مستقرة في طريقة 
ARCI)‏ والتي تكون فيها 1 = ,م (والتي تعرف أيضا بأنها المسار العشوائي) تعتبر 
نظرية المتممة و فحص غير رسمي» برنامج ستاتا يوفر ثلاثة اختبارات لجذر 
الوحدة شي : pperron‏ (فيليبس- برون dfuller «(Phillips-Perron‏ (ديكي -فولر 
المتمم dfgls «(augmented Dickey-Fuller‏ (ديكي - فولر المتمم باستخدام ((GLS‏ 
ويُعتبر اختبار dfgls‏ أقوى الاختبارات وأكثر معلومات. 
الجدول أدناه يُطبق الأمر 415 على بيانات المركز الوطني للمناخ 
(NCDC)‏ وهي درجات الحرارة العالمية الشاذة. 
-dfgls ncdctemp, notrend‏ 


DF-GLS for ncdctemp Number of obs - 355 
Maxlag - 16 chosen by Schwert criterion 





DF-GLS mu 1% Critical 5$ Critical 10% Critical 
[1ags] Test Statistic Value Value Value 
16 -1.162 -2.580 -1.952 -1.637 
15 -1.191 -2.580 -1.955 -1.640 
14 -1.179 -2.580 ^ -1.958 -1.643 
13 -1.170 -2.580 -1.962 -1.646 
12 -1.194 -2.580 -1.965 -1.649 
11 -1.264 -2.580 -1.968 -1.652 
10 -1.190 -2.580 -1.971 -1.655 
9 -1.204 -2.580 -1.974 -1.658 
B -1.525 -2.580 -1.977 -1.660 
7 -1.462 -2.580 -1.980 -1.663 
6 -1.639 -2 0 -1.982 -1.665 
5 -1.844 -2.580 -1.985 -1.668 
4 -1.968 -2.580 -1.988 -1.670 
3 -2.058 -2.580 -1.990 -1.672 
2 -2.342 -2.580 -1.993 -1.675 
1 -2.731 -2.580 -1.995 -1.677 
Opt Lag (Ng-Perron seq t) = 9 with RMSE .091533? ° 
Min sc -4.687887 at lag 1 with RMSE . 0943745 


Min MAIC = -4.721196 ac lag 9 with RMSE .0915337 Pd 
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مخرجات الأمر dfgls.‏ أعلاه توضح. QU‏ اختبارات عدم استقرارية فرضية 
العدم التي تقول Gb‏ سلسلة درجات الحرارة تمثل مسار عشوائياً أو لها جذر 
وحدة لفترات تباطؤ من 1 إلى 16 شهراء وفي أسفل جدول المخرجات هناك 
ثلاث طرق مختلفة لاختيار العدد المناسب من فترات التباطؤ: -Ng‏ بيرون 
التتابعي «/Ng-Perron sequential‏ معيار المعلومات شوارتز Schwarz‏ الأقل» 
“Ng‏ بيرون لمعيار معلومات أكيكا Akaike‏ المعدلة MAIC (MAIC)‏ والذي تم 
تطويره مؤخراء وتجربة مونت Monte Carlo sl lS‏ كلاهما يدعم مميزات 
طريقة شوارتز. إن انتظام ؛ MAIC y‏ توصي باستخدام 9 فترات تباطؤ. كما أن 
النتائج توضح gh‏ إحصائية DF-GLS‏ ل 9 فترات تباطؤ هي 1.204- وهي 
أكبر من %10 من القيمة الحرجة وهي 71.658 ولذلك يجب علينا رفض 
فرضية العدم. هذه النتائج تؤكد الانطباعات السابقة» والتي تقول بأن السلسلة 
الزمنية nedctemp‏ ليست مستقرة. 

وهن old ceil galt‏ هناك اختارا ENSO pha luba‏ المخد دد 
يرفض فرضية عدم الاستقرار .عند كل فترات التباطؤ حتى مستوى Hl‏ 


. 028915 mei, notrend 


DF-GLS for mei Number of obs - 355 
Maxlag - 16 chosen by Schwert criterion 


DF-GLS mu 1% Critical 5$ Critical 10$ Critical 

(lags) Test Statistic Value Value Value 

16 -3.686 -2.580 -1.952 -1.637 

15 -3.742 -2.580 -1.955 -1.640 

14 -3.681 -2.580 -1.958 -1.643 

13 -4.062 -2.580 -1.962 -1.646 

12 -4.381 -2.580 -1.965 -1.649 

11 -4.352 -2.580 -1.968 -1.652 

10 -4.420 -2.580 -1.971 -1.655 

9 -4.451 -2.580 -1.974 -1.658 

8 -4.589 -2.580 -1.977 -1.660 

7 -4.604 -2.590 -1.980 -1.663 

6 -4.655 -2.580 -1.982 -1.665 

5 -4.699 -2.580 -1.985 -1.668 

4 -4.591 -2.580 -1.988 -1.670 

3 -4.909 -2.580 71.990 -1.672 

2 -4.293 -2.580 -1.993 -1.675 

1 -4.049 -2.580 -1.995 71.677 
Opt Lag (Ng-Perron seq t) = 3 with RMSE .2688427 
Min SC = -2.565539 at lag 1 with RMSE .2727197 
Min MAIC = -2.497381 at lag 1 with RMSE .2727197 


بالنسية للسلاسل المستقرة «mei Sie‏ فإن التمثيل البياني للارتباط يعثبر 
دليلا حول اختيار نموذج ARIMA‏ المبدئي: 
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ب و ا ا ا P‏ 
AR(p)‏ الانحدار الذاتي من الدرجة «p‏ وله ارتباطات ذائية تنخفض بشكل 
تدريجي مع كل زيادة في فترات التباطو. الإرتباطات الذاتية 
الجزئية تتوقف بعد فترة تباطو p‏ 
MA(q)‏ المتوسط المتحرك من g åa jal‏ وله caus J‏ ذائية تتوقف بعد 
فترة تباطو 4q‏ الارتباطات الذائية الجزئية تنخفض تدريجيا مع 
كل زيادة في فترات التباطؤ. 
ARMA(p,q)‏ المتوسط المتحرك - الانحدار الذاتي المختلط والذي له ارتباطات 
áli‏ وارتباطات ذاتية جزئية تنخفض تدريجياً مع كل زيادة في 
فترات التباطو. 
المنحنى البياني للارتباط يزداد بدرجة كبيرة عند فترات تباطؤ موسمية 
Sha)‏ عند 12 أو 24 أو 36 في البيانات الشهرية) مشيرا إلى نمط موسميء 
تحديد النماذج الشهرية يتبع نفس الطريقة التي تم تطبيقها على الارتباطات 
الذاتيةء والارتباطات الذاتية الجزئية عند فترات تباطو موسمية. 
رأينا سابقا أن الارتباطات الذاتية للمتغير mei‏ تنخفض تدريجياً مع زيادة 
فترات التباطؤ (الشكل 14.12( بينما الارتباطات الذاتية الجزئية تتوقف بعد 
فترة تباطؤ تساوي 2. هذا النمط في التمثيل البياني للارتباط مع نتائج اختبار 
dfgls‏ تدعم الاستقرارء وتشير إلى أنه بالإمكان صياغة c‏ للمتغير mei‏ 
وذلك بعملية -ARIMA(2,0,0)‏ 
.arima mei, arima(2,0,0) nolog‏ 


ARIMA regression 7 

Sample:  Jan1980 - Dec2010 Number of obs = 372 
Wald chi2(2) = 4395.66 

Log likelihood = -43.61494 Prob > chi2 = 0.0000 








OPG 
Std. Err. 





(95% Conf. Interval] 













. 2814275 -2132974 -.1366278 - 6994828 





1.349918 -0424774 : 1.266664 1.433173 
-.4163392 -0415425 -10.02 0.000 -.497761 7.3343174 


-2710638 .0091183 29.73 0.000 .2531922 7 .2889354 





Note: The test of the variance against zero is one sided, and the two-sided confidence interval is 
truncated at zero. 
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نموذج ARIMA(2,0,0)‏ يمثل المتغير mei‏ كدالة للأخطاء (u)‏ من شهر 
ماضي وشهرين ماضيين» بالإضافة إلى أخطاء الضجة البيضاء العشوائية 
(ع): 
ua + Phat €, [5.12]‏ ,م y, = Bot‏ 


حيث إن: y,‏ قيمة المتغير mei‏ عند الزمن a‏ مخرجات الجدول 5 C—‏ 
معلمية لتقدير 0.28 f‏ € 9,7135« 0.42 = رم. 


بعد صياغة نموذج arima‏ هذه المُقدّرات والنتائج الأخرى يتم حفظها 
بشكل مؤقت بطريقة ستاتا المعتادة» فمثلا لمشاهدة معامل النموذج AR(1)‏ 
والخطأ المعياري نقوم بطباعة الأمر: 
.display [ARMA]. b[L1.ar]‏ 
1.3499184 


.display [ARMA] se[L1.ar] 
.04247738 


معاملات الانحدار الذاتي من الدرجة الأو لى والدرجة الثانية في هذا 

المثال» كلها ذات معنوية إحصائية وبعيدة جدا عن الصفرء (31.78-/ و10.02- 

على التوالي) وهذا يشير إلى شيء واحدء وهو أن النموذج مناسب» ويمكننا 

الحصول على القيم المتوقعة والبواقي والإحصائيات الأخرى بعد الأمر 
arima‏ من خلال الأمر predict‏ : 

predict meihat 

-label variable meihat "predicted MEI" 


.predict meires, resid 
.label variable meires "residual MzI' 


بيانياًء فإن القيم المتوقعة من هذا النموذج تظهرغير واضحة من درجات 
الحرارة المشاهدة USA)‏ 16.12(. هذه الصورة توضح مدى تقارب نماذج 
«ARIMA‏ والتي يمكنها أن cauli‏ بدرجة كبيرة مع السلاسل المرتبطة ذاتيا 
من خلال التنبؤ بمتغير من خلال قيمه السابقةء .بالإضافة إلى قيم الأخطاء 
السابقة» نموذج d ARIMA(2,0,0)‏ حوالي %90 من تباين المتغير „mei‏ 
.tsline meimeihat, lcolor(blue red)‏ 
lwidth (medium medthick)‏ 
xtitle("") xlabel(, grid gmax gmin)‏ 
ytitle("MEI') :‏ 
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eS E‏ ا 
ylabel(-2(1)3, grid gmin gmax) yline(0,‏ 
lcolor(gs12) )‏ 





Jan1960 Jan1990 Jan2000 Jan2010 








Multivarlate ENSO Index predicted MEI 


الشكل )16.12( 


اختبار مهم لكفاءة نموذج ARIMA‏ يتم من خلال ما إذا كانت البواقي 
تظهر غير مترابطة مع التشويش. الأمر corrgram‏ يختبر فرضية العدم 
للضجة البيضاء من خلال فترات تباطو مختلفة. 


.Corrgram meires, lags(13) 





-1 0 1 -1 0 1 
Las ac PAC Q Prob>Q [Autocorrelation] (Partial Autocor] 
1 -0.0241 -0.0241 .2176 0.6409 
2 -0.0099 -0.0105 .25451 0.8805 
3 0.1430 0.1430 7.9641 0.0468 
4 -0.0015 0.0043 7.965 0.0929 
5 0.0256 0.0292 8.2135 0.1449 
6 0.0200 0.0010 8.3656 0.2125 
7 -0.0305 -0.0315 8.7197 0.2734 
B -0.0001 -0.0109 8.7197 0:3665 
9 -0.0306 -0.0367 9.0787 0.4300 
10 -0.0274 -0.0256 9.3682 0.4976 
11 -0.0292 -0.0331 9.6962 0.5579 
12 -0.0009 0.0079 9.6966 0.6426 
13 -0.0449 -0.0404 10.477 0.6545 


اختبارات portmanteau Ócorrgram‏ لم تجد أي ارتباط ذاتي ذي معنوية 
إحصائية بين لبو اقي حتى فترة تباطؤ تساوي 13( باستثناء علاقة واحدة فقط 
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بمستوى أقل من 0.05 عند فترة التباطؤ 3 يمكننا القيام بنفس الاختبار لأي 
فترة تباطو معنية باستخدام الأمر wntestg‏ مثل: 
.wntestq meires, lags(13)‏ 
Portmanteau test for white noise‏ 


Portmanteau (Q) statistic - . 10.4772 
Prob » chi2(13) = 0.6545 


ولذاء فإن نموذج ARIMA(2,0,0)‏ تم اقتراحه بعد النظر إلى الأنماط 
الموجودة ببيانات الارتباط الذاتي» والتي توضح بأن النموذج يتناسب بدرجة 
كبيرة» cus‏ إن كل صيغ الخطأ GIS AR‏ معنوية إحصائية» وهذا يترك 
البواقي التي اجتازت اختبار الضجة البيضاء. 
اختباراتنا السابقة notrend «dfgls‏ لدرجات الحرارة العالمية الشاذة 
—(ncdctemp)‏ تختلف عن اختبار مؤشر ENSO‏ التراكمي —(mei)‏ حيث إنها 
توضح ob‏ درجات الحرارة تظهر غير مستقرة بسبب أنها تتضمن اتجاها 
Lies‏ مسيطراء اختبار 4616 الافتراضي يتضمن اتجاهاً ad‏ يرفض فرضية 
العدم التي تفترض عدم الاستقرار عند كل فترات التباطؤ. 
ncdctemp‏ 08915 . 


DF-GLS for ncdctemp Number of obs - 355 
Maxlag - 16 chosen by Schwert criterion 





DF-GLS tau 1% Critical 5$ Critical 10$ Critical 

[1ags] Test Statistic Value Value Value 
16 -3.624 -3.480 -2.818 -2.536 

15 -3.625 -3.480 -2.824 -2.542 

14 -3.552 -3.480 -2.829 -2.547 

13 -3.489 -3.480 -2.835 -2.552 

12 -3.486 -3.480 -2.840 -2.557 

11 -3.566 -3.480 -2.846 -2.562 

10 73.395 -3.480 -2.B51 -2.566 

9 23:377 -3.480 -2.856 -2.571 
-3.861 -3.480 -2.861 -2.575 

7 -3.697 -3.480 -2.865 -2.580 

6 -3.950 -3.490 -2.870 -2.584 

5 -4.251 -3.480 -2.874 -2.588 

4 ` 49 -3.480 -2.879 -2.592 

3 -4.479 -3.480 -2.883 -2.595 

2 -4.920 -3.480 -2.887 -2.599 

1 -5.505 -3.480 -2.891 -2.602 

Opt Lag (Ng-Perron seq t) = 9 with RMSE . 8 
Min SC ع‎ -4.749446 at lag 1 with RMSE .0915139 


Min MAIC = -4.639686 at lag 9 with RMSE .0902188 
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الاختلاف الأولي للسلاسل الزمنيةء سوف يزيل الاتجاه الخطي» 
الاختلافات الأولية لدرجات الحرارة توضح نمطا من الارتباطات الذاتية التي 
تتوقف بعد فترة تباطؤ تساوي 1» والارتباطات الذاتية الجزئية تنخفض بعد 
فتراة تباطؤ تساوي 1. 


.corrgram D.ncdctemp, lag(13) 





-1 0 1-1 0 1 

LAG AC PAC Q Prob»Q  [Autocorrelation] (Partial Autocor] 
1 -0.3941 -0.4031 58.094 0.0000 
2 0.0425 -0.1355 58.773 0.0000 
3 -0.0639 -0.1174 60.307 0.0000 
4 0.0305 -0.0479 60.656 0.0000 
5 -0.0359  -0.0614 61.145 0.0000 
6 -0.0385  -0.1032 61.706 0.0000 
7 -0.0035 -0.0872 61.711 0.0000 
8 0.0633 0.0164 63.239 0.0000 
9 -0.1316 -0.1432 69.861 0.0000 
10 0.1031 -0.0149 73.938 0.0000 
11 0.0030 0.0359 73.942 0.0000 
12 -0.0353 -0.0393 74.421 0.0000 
13 0.0099 -0.0175 74.459 0.0000 


هذه المشاهدات تشير إلى أن نموذج ARIMA(0,1,1)‏ قد يكون مناسباً 
لدرجات الحرارة. 


.arima ncdctemp, arima(0,1,1) nolog 


ARIMA regression 


Sample:  Febl980 - Dec2010 Number of obs = 371 
Wald chi2(1) = 152.87 
Log likelihood = 355.3385 Prob > chi2 = 0.0000 







D.ncdctemp 





(95$ Conf. Interval] 





ncdctemp 










-cons .0007623 





.0025694 -.0042737 .0057982 










-.4994929 -040399 -.5786735 -.4203124 





/sigma 0928235 0029514 31.45 0.000 . 0870388 .0986081 
N ad 


Note: The test of the variance against zero is one sided, and the two-sided confidence interval is 
truncated at zero. i 


الفصل الثاني عشر : تحليل السلاسل الزمنية 589 





نموذج ARIMA(,I,D)‏ يشرح الاختلاف الأول أو التغير من شهر إلى 
شهر في درجة الحرارة كدالة للخطأ العشوائي مع فترة تباطؤ تساوي شهراً 
واحدا أو كدالة للخطأ العشوائى للشهر الحالى: 

y Ya = 60 tO, +E, [6.12] 

حيث إن: y,‏ تمثل المتغير nedctemp‏ عند الزمن «t‏ ومقدّرات المعلميات 

هي 0.00076 = Bo‏ و0.499- = 0« MA as‏ من الدرجة الأولى 6 ذو معنوية 

إحصائية )0.000 (p‏ وبواقي النموذج لا يمكن تمييزها عن الضجة البيضاء. 

.predict Dncdchat 

.label variable Dncdchat "predicted 1st diff 

temp' 

.predict Dncdcres, resid 

.label variable Dncdcres "residual 1st diff 


temp' 
-corrgram Dncdcres, lag(13) 


-1 0 1-1 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] 
1 0.0133 0.0135 .06574 0.7976 
2 0.0262 0.0265 .32335 0.8507 
3 -0.0631 -0.0657 1.8204 0.6105 
4 -0.0313 -0.0306 2.1907 0.7007 
5 -0.0848 -0.0827 4.912 0.4267 
6 -0.0867 -0.0910 7.7626 0.2560 
7 -0.0357 -0.0362 8.2477 0.3113 
8 0.0079 -0.0002 8.2716 0.4074 
9 -0.0970 -0.1201 11.866 0.2210 
10 0.0759 0.0635 14.074 0.1696 
11 0.0255 0.0143 14.324 0.2156 
12 -0.0225 -0.0568 14.519 0.2688 
13 0.0008 -0.0004 14.519 0.3383 


ab lh‏ من أن هذه :الاختبازات لا ly Ge‏ واض حا لان عاد 
CARIMA(,1,1)‏ إلا أنه من الصعب تنبو التغيرات الشهرية في درجات 
الحرارة العالمية الشاذة» الشكل )17.12( يستخدم مُعامل الاختلاف D.‏ في 
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الأمر graph‏ لعرض تناسب بسيط بين القيم المتوقعة والقيم المشاهدة هذا 
النموذج يشرح حوالي 0 من التباين في الاختلافات الشهرية. 
-tsline D.ncdctempDncdchat, lcolor(blue red)‏ 
xtitle("") xlabel(, grid gmax gmin)‏ 
lw(medthick medium)‏ 
ytitle("Monthly change in temperature,‏ 
`=char (176) 'C")‏ 
ylabel(, grid gmin gmax) yline (0)‏ 
legend (ring (0) position (7)‏ 
row(2) label(1 "change in temp") label (2‏ 
"predicted change") )‏ 


xz 


0 2 


Monthly change in temperature, *C 
-2 





———— change in temp 





+ predicted change 





Jan1980 Jan1990 , Jan2000 Jan2010 


الشكل )17.12( 

الرسم البياني للتغيرات أو الاختلافات الأولى في الشكل )17.12( 
يعطي تشابهاً بسيطاً مع درجات الحرارة الشاذة نفسها التي سبق مشاهدتها في 
الشكل )9.12( العكس يؤكد بأن صياغة نماذج للاختلافات الأولى يعطصي 
الإجابة عن سؤال بحث مختلف. 

في هذا المثال الميزة الرئيسة Gla jal‏ الحرارة المسجلة - الاتجاه نحو 
الارتفاع - تم استبعاده؛ الجزء التالي يعود إلى درجات الحرارة الشاذة غير 
المختلفة ويأخذ في الاعتبار كيفية إمكانية شرح هذا الاتجاه نفسه. 
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ARMAX Models : (ARMAX) مادج‎ 


سابقاً في هذا الفصل» رأينا أن انحدار OLS‏ للمتغير nedetemp‏ مع أربعة 
متغيرات تنبؤية باربع فترات تباطؤ يعطي تناسبا جيذا مع ad‏ درجات الحرارة 
المشاهدة (الشكل 2.12( بالإضافة إلى تقديرات معلمية معقولة» اختبار دربن 
واتسون Durbin-Watson‏ أظهر بأن هناك ارتباطات ذاتية ذات معنوية بين البواقي 
وهذا يقوّض اختبارات F‏ و01.5). ولحل هذه المشكلة نقوم باستخدام نماذج 
ARMAX‏ (المتوسط المتحرك للانحدار الذاتي مع متغيرات خارجية). 


نموذج ARMAX‏ مع متغيرات تنبؤية بفقرات تباطؤ لشهر واحد 
واضطراب ARIMA(I,0,1)‏ اتضح axo‏ يتناسب بشكل جيد. 


.arima ncdctemp L1.aod L1.tsil L1.mei 
Li.co2anom, arima(1,0,1) nolog 


ARIMA regression 


Sample:  Febl1980 - Dec2010 Number of obs z 371 
Wald chi2(6) = 555.93 
Log likelihood = 376.3487 Prob > chi2 = 0.0000 












OPG 
Coef. Std. Err. z P» |z| [95$ Conf. Interval] 





ncdctemp 














ncdctemp 


aod 

L1. -1.228967 .3855346 -3.19 0.001 -1.984601 -.4733331 

tsil 

L1. .0609574 -0173356 3.52 0.000 .0269803 .0949345 

mei 

L1. .0533736 .0099622 5.36 0.000 .033848 .0728992 
co2anom 

L1. .0104806 .0008328 12.58 0.000 . 0088483 .0121128 


-cons -82.84697 23.68097 -129.2608 -36.43313 














. 7119696 - 0703746 10.12 0.000 .5740378 . 8499013 


ma 


-.3229314 -0944706 -.5080903 





-.1377725 











.0872355 .0028313 .0816863 .0927847 


Note: The test of the variance against zero is one sided, and the two-sided confidence interval is 
truncated at zero. 
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في هذا النموذج ,برأو المتغير nedetemp‏ عند الزمن r‏ هو دالة لقيم 
المتغيرات التنبؤية من xi‏ وحتى ب× مع فترة تباطؤ تساوي 1 oda)‏ المتغيرات 
من aod‏ وحتى (co2anom‏ واضطر اب iu)‏ 

yı = Po + Bia + Boxer + Baa + PX tH [7.12] 

الاضطراب عند الزمن iu)‏ يتعلق باضطراب مع فترة تباطؤ تساوي | 
(un)‏ ومتعلق كذلك بأخطاء عشوائية لها فترة تباطؤ تساوي 1 عند الزمن ؛ 
(e, 5€)‏ 

u-pu,.-0e,,-e, [8.12] 

معاملات كل المتغيرات التنبؤية الأربعةء وكذلك حدود MA 5 AR‏ 
جميعها ذات å; gine‏ إحصائية عند 0.01 > م أو أفضل من ذلكء المتغير 
ncdctemp‏ نفسه غير مستقرء وليست هناك dale‏ ليكون كذلك في هذا 
التحليل» وعدم استقراره هو نقطة التركيز في البحث. البواقي من أي نموذج 
ناجح يُفترض أن تتشابه مع قيمة الضجة البيضاءء وقيمة استقرار التغاير 
وهذا هو الوضع هنا. حيث إن: اختبار © يعطي 0.60 = م للبواقي التي 
لها فترات تباطؤ تصل حتى 25. 


.predict ncdchat2 


.label variable ncdchat2 "Predicted from 
volcanoes, solar, ENSO & CO2' 


.predict ncdcres2, resid 


.label variable ncdcres2 "NCDC residuals from 
ARMAX model' 


.corrgram ncdcres2, lags(25) 
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-1 0 1 -1 0 1 
LAG AC PAC Q Prob>Q [Autocorrelation] [Partial Autocor] 
1 -0.0133 -0.0136 .06661 0.7963 
2 0.0458 0.0471 .85498 0.6521 
3 -0.0089 -0.0084 .88473 0.8291 
4 0.0248 0.0229 1.1169 0.8916 
5 -0.0359 -0.0356 1.6043 0.9007 
6 -0.0658 -0.0710 3.245 0.7775 
7 -0.0060 -0.0035 3.2588 '0.8601 
8 0.0116 0.0177 3.3097 0.9134 
9 -0.0949 -0.0979 6.7554 0.6626 
10 0.0832 0.0868 9.4103 0.4937 
11 0.0341 0.0433 9.8585 0.5432 
12 0.0052 -0.0105 9.869 0.6275 
13 0.0388 0.0457 10.45 0.6568 
14 0.0330 0.0288 10.873 0.6960 
15 -0.0110 -0.0273 ` 10.92 0.7583 
16 -0.0381 -0.0288 11.485 0.7786 
17 -0.0871 -0.0861 14.449 0.6351 
18 -0.0384 -0.0537 15.028 0.6601 
19 -0.0180 0.0130 15.155 0.7127 
20 -0.0508 -0.0484 16.174 0.7058 
21 -0.0619 -0.0764 17.688 0.6686 
22 0.0339 0.0422 18.143 0.6975 
23 0.0557 0.0551 19.379 0.6790 
24 0.0779 0.0652 21.802 0.5911 
25 0.0457 0.0457 22.638 0.5987 


الشكل )18.12( يعرض التناسب الكبير بين البيانات ونموذج “ARMAX‏ 
النموذج يفسّر حوالي 9677 من التباين في درجات الحرارة الشاذة. نتائج 
ARMAX‏ تدعم نتيجة عامة من نتائج OLS‏ السابقة» حيث إن الاتجاه 
المتصاعد خلال عقود متعددة في درجات الحرارة لا يمكن تفسيره بدون 
الأخذ في الاعتبار العوامل البشرية. ومن ناحية أخرىء فإن الانخفاض 
الواضح في الاحتباس الحراري خلال العقد الأخير يمكن تفسيره في ظل 
ظاهرة طبيعية إلينوي» وظاهرة انخفاض أشعة.الشمس. 
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حتى هذه النقطةء لدينا تفاصيل عن مؤشر واحد لدرجة الحرارة من 
ثلاثة مؤشرات بملف البيانات .Climate.dta‏ هذا المؤشر تم استخراجه من 
بيانات المركز الوطني للمناخ (NCDC)‏ التابع للإدارة الوطنية للغلاف الجوي 
والمحيط بالولايات المتحدة NCDC (NOAA)‏ حيث قام بحساب مؤشره 
الخاص به eU‏ على قياسات درجة حرارة السطح. والتي تم أخذها من YT‏ 
المحطات حول العالم. مركز ناسا لدراسات الفضاء قام بحساب مؤشره 
الخاص بدرجة الحرارة (يُطلق عليه (GISTEMP‏ والذي يعتمد على قياسات 
المحطات لدرجة حرارة السطح» ولكن مع تغطية جيدة للمناطق التي تقع في 
أقصى الشمال. 

مؤشر درجة الحرارة الثالث في الملف Climate. dta.‏ له قاعدة مختلفة»› 
فالباحثون بجامعة الباما هندسفيل (UAH)‏ قاموا بحساب مؤشرهم العالمي من 
مقاييس غير مباشرة من الأقمار الصناعة التي قامت بتصوير طبقات الجو 
العليا وأجواء الأرض عند ارتفاع حوالي 4 كيلومترات» التقديرات التي تعتمد 
على الأقمار الصناعية توضح تغير كبيرًا من شهر إلى شهر وهي تغيرات 
حساسة لظهور yu‏ ولانينا. هذه التقديرات تعتبر نظرة بديلة عن اتجاهات 
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درجات الحرارة العالميةء وهي تتشابه. مع سجلات «dall‏ ولكنها cà A5‏ 
قليلا في التفاصيل. السؤال هنا: كيف يتم عرض هذه الاختلافات عندما نقوم 
بصياغة نموذج للمتغير uahtemp‏ بنفس طريقة ARMAX‏ التي تم استخدامها 
مع المتغير fncdctemp‏ 


.arima uahtemp L1.aod L1.tsil L1.mei 
L1.co2anom,arima(1,0,1) nolog 


ARIMA regression 


Sample:  Feb1980 - Dec2010 Number of obs = 371 
Wald chi2 (6) = 601.88 
Log likelihood = 299.2819 Prob > chi2 2 0.0000 
OPG 
uahtemp Coef. Std. Err. z P»|z| [95$ Conf. Interval] 
uahtemp 
aod 
L1. -2.38566 .9011263 -2.65 0.008 -4.151835 -.6194849 
tsil 
L1. .0336446 .0289365 1.16 0.245 -.0230698 .0903591 
mei 
Li.. .0663992 .0154607 4.29 0.000 .0360967 .0967016 
co2anom 
L1. .0084778 .0016671 5.09 0.000 .0052103 .0117453 
_cons -45.92206 39.52334 -1.16 0.245 -123.3864 31.54227 
ARMA 
ar 
L1. .8364133 .0421928 19.82 0.000 .7537169 .9191097 
ma 
L1. -.3170064 .068849 -4.60 0.000 -.451948 -.1820648 
/sigma .1078988 .0040726 26.49 0.000 .0999167 .115881 


Note: The test of the variance against zero is one sided, and the two-sided confidence interval is 
truncated at zero. 


معاملات نموذج NCDC‏ ونموذج -UAH‏ كما أن معاملات NASA‏ لم يتم 
عرضها هنا - كلها لها نفس الإشارة وتتشابه مع الفهم الطبيعي. كل النماذج 
الثلاثة تؤكد gh‏ أقوى متغير تنبؤي Gila jal‏ الحرارة هو القيم الشاذة ل CO,‏ 
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وثاني أقوى متغير تنبؤي هو MEI‏ المتغير MEI‏ له تأثير أكبر نسبيا في 
نموذج (UAH‏ وهذا هو المتوقع من بيانات الأقمار الصناعيةء كما أن ثورات 
البراكين Los Gl‏ تارات قر على فوشن 0۸ dad Lin‏ الشمين كانت 
لها تأثيرات أقل قوةء هذا يعكس التغير المرتفع في التقديرات التي تعتمد على 
الأقمار الصناعةء كما أن النموذج يشرح حوالي %70 من التباين في المتغير 
م مقارنة مع %77 للمتغير incdetemp‏ وعموما فإن البواقي اجتازت 
الاختبارات الخاصة بالضجة البيضاء )0.65 = «p.‏ والرسم البياني للقيم 
المتوقعة والمشاهدة يعرض تناسبا مرئيا Vus.‏ (الشكل 19.12). 

.-predict uahhat2 


.label variable uahhat2 "Predicted from 
volcanoes, 


solar, ENSO & CO2' 
predict uahres2, resid 


.label variable uahres2 "UAH residuals from 
ARMAX model’ 


.wntestq uahres2, lags (25) 


Portmanteau test for white noise 





Portmanteau (Q) statistic = ° 21.7197 
Prob > chi2(25) = 0.6519 


1 
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الشكل )19.12( 


— 
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درجات الحرارة المسجلة بالأقمار الصناعية تمثل بيانات ASÍ‏ حداثة من 
My iia gall abus jy! caasa Cis‏ فان درخات yall‏ )3 'الشاذة UAH‏ 
يمكن حسابها للفترة من 2010-1981 كنقطة بداية Yas‏ من 2000-1901. 
كما تم القيام به من قبل Ali .NCDC‏ البداية تنتقل إلى نقطة الصفر لدرجات 
الحرارة الشاذة الأعلى» والذي يمكن رؤيته عند مقارنة الشكل )19.12( مع 
الشكل )18.12( WS‏ السلسلتين تعطيان نفس الاتجاهات وهي حوالي 0.16 
درجة مئو ية/عقد لدرجات حرارة NCDC‏ (أو (NASA‏ خلال هذه الفقرة أو 
5 درجة مئوية/عقد لدرجات حرارة „UAH‏ 

الاستنتاجات من نماذج ARMAX‏ البسيطة تتفق بشكل عام مع تلك التي 
e‏ الحصول عليها من تحليلات أكثر laii‏ في درأسة Foster and Rahmstorf‏ 
(2011)» حيث إن طريقتهما تتضمن البحث عن مواصفات فترة التباطؤ 
المثلى؛ وهذا على عكس ما قمنا به هنا باختيار عشوائي لفترة تباطؤ شهر 
واحد لكل المتغيرات التنبؤية. كما أن دراسة Foster and Rahmstorf‏ تضمنت 
دوال مثلثية (سلاسل فوريير من الدرجة الثانية) لصياغة نماذج الدورات 
السنوية للبواقي في البيانات. كما تم تضمين الزمن بدلاً من تركيز CO;‏ 
ضمن المتغيرات التنبؤية» وذلك لتوضيح الاتجاهات الزمنية. ولكن هذه 
الاتجاهات تم تفسيرها بأنها أسباب بشرية. ومبدئيا فإن هذه الأسباب البشرية 
يمكن أن تتضمن الغازات المسببة للاحتباس الحراري إلى جانب «COP‏ 
والأنشطة الأخرى Uis‏ إزالة الغابات» وتغير الغطاء النباتيء أو استنزاف 
طبقة الأوزون التي يمكن قياسها بواسطة متغير ,ه026ه. ولذا فإن التفسير 
السببي CO‏ قد يكون بسيطاً جداً. وعملياً فإن CO;‏ ازداد بشكل مباشر مع 
الوقت (الشكل 10.12( مستخدماً الوقت أو CO,‏ كمتغير تنبؤي سوف يعطي 


LIAO) qe) 
صياغة نماذج التأثيرات المختلطة‎ 
والمستويات المتعددة‎ 
Multilevel and Mixed-Effects Modeling 





صياغة نماذج التأثيرات المختلطة هي عبارة.عن تحليل انحدار يسمح 
بنوعين من التأثيرات» التأثيرات الثابتة: وهذا يعني أنها قيم التقاطع والميل» 
وهي تقوم بتفسير المجتمع ككل كما هو الوضع في الانحدار العادي. وأيضا 
ci ia‏ العشوائية: وتعني أن قيم التقاطع والميل يمكنها أن تكون متنوعة 

في المجموعات الفرعية للعينة: كل طرق الانحدار التي تم تناولها حتى الآن 
في هذا الكتاب» تتضمن التأثيرات الثابتة فقط. صياغة نماذج للتأثيرات 
المختلطة تفتح مجالاً جديذا لاحتمالات نماذج المستويات المتعددة» وتخليل 
منحنى النموء والبيانات الطولية» والسلاسل الزمنية المقطعية. 

دراسة Albright and Marinova‏ (2010) توضح مقارنة عملية بين طريقة 
صياغة النماذج المختلطة ببرنامج ستاتا 5 SAS‏ و5555 و۸ مع برنامج 
صياغة نموذج خطي ترتيبي (HLM)the hierarchical linear modeling‏ تم 
تطويره بواأسطة Raudenbush and Bryck and (2005) Raudenbush et‏ )2002( 
cal.‏ ويمكن الاطلاع على شرح أكثر تفصيلاً للنماذج الثابتة وارتباطاتها مع 
HLM‏ في كتاب Rabe- Hesketh and Skrondal‏ 001 وباختصارء فإن طرق 
HLM‏ لصياغة النماذج ذات المستويات المتعددة تتم بعدة خطوات هي: تحديد 
معادلات منفصلة. فعلى سبيل المثال» لتأثيرات ME‏ | واللمستوى 2؛ 
وفني الواقع العملي هذه المعادلات لا يمكن تقديرها بطريقة منفصلةء ولذلك 
فإن البرنامج Lisle ase‏ بالاستعاضة عن ذلك من خلال إنشاء معادلة 
مختصرة واحدة للتقدير. طريقة صياغة نماذج التأثيرات المختلطة تعمل 
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مباشرة ae‏ المغاذلة المختصرة معطيا إياها مظهرا ذا cul uaa!‏ متغددة "Ud‏ 
من طريقة HLM‏ حتى عندما تقوم الطريقتان بتفسير النماذج المتكاففة 
رياضيا. تأثيرات HLM‏ عند مستويات مختلفة» يمكنها أن تكون ممثلة بشكل 
متكافئ للتأثيرات العشوائية أو الثابتة» مع معادلة مختصرة aal y‏ وقد Bay‏ 
Rabe-Hesketh and Skrondal‏ (2012:171) بأن هناك بعض الاختلافات الثقافية 
بين «HLM‏ وتطبيقات النماذج المختلفة: البحوث التي استخدمت [HLM]‏ تميل 
لتضمين تفاعلات أكثر عند مستويات مختلفة» ومعاملات عشوائية أكثر فى 
النماذج (لأن نماذج المستوى 2 تظهر بشكل غريب بدون بواقي) هن PT‏ 
التي تستخدم ستاتا مثلا. 

. هناك ثلاثة أوامر ستاتا تمثل الأداة الأكشذر شيوعا لصياغة نماذج 
التأثيرات المختلطة؛ وذات المستويات المتعددة. الأمر xtmixed‏ يُناسب 
النماذج الخطية مثل نظيره للتأثيرات المختلطةء وهو الأمرووءمعه:. وبالمثلء 
فإن الأمر xtmelogit‏ يُناسب نماذج الانحدار اللوغاريتمية للتأثير ات المختلطة 
للمخرجات الثنائيةء وكذلك فإن الأوامر cus xtmepoisson 5 logistic 5 logit‏ 
نماذج بواسون للتأثيرات المختلطة للمخرجات المعدودة مثل تعميم الأمر 
poisso‏ . برنامج ستاتا يوفر أيضا عددا أكثز من طرق الحساب المتعلقة 

ببعض المهام المفاهيمية» الأمثلة تتضمن نماذج GIS‏ حدين سالبة واحتماليةء 
CNN‏ مع تقاطعات عشوائية. للحصول على قائمة كاملة مع روابط 
للتفاصيل عن كل أمرء قم بطباعة الأمر help xt‏ العديد من الأوامر تم 
تطويرها أولاً للاستخدام مع بيانات سلاسل زمنية مقطعية أو طوليةء ولذلك 
فإن أوامرها تبدأ ب xt‏ 
إجراءات الأوامر xtmepoisson 5 xtmelogit s xtmixed‏ يمكن تطبيقها من 
خلال طباعة الأوامرء أو من خلال القوائم: 
Statistics < Multilevel mixed-effects models‏ 
قوائم الحسابات الأخرى ل xt‏ تم وضعها بشكل منفصل تحت تحت القائمة 
التالية: 


Statistics < Longitudinal/panel data 1 
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يحتوي دليل المستخدم Longitudinal/Panel Data Reference Manual‏ على 
أمثلةء وتفاصيل تقنية» ومراجع للتأثيرات المختلطة» وطرق xt‏ الأخرى؛ 
كتاب Luke‏ )2004( يعرض مقدمة مختصرة عبن صياغة النماذج ذات 
المستويات المتعددة. كما أن هناك شرحا أكثر Saad‏ في كتاب )2007( 
Bickel‏ و McCulloch and Searle GUS‏ )2001( وكتاب Raudenbush and‏ )2002( 
Bryk‏ وكذلك aa yall (2000) Verbeke and Molenberghs GS‏ الخاص eX‏ 
لمستخدمي برنامج ستاتاء هو US‏ بعنوان "Multilevel and Longitudinal‏ 
"Modeling Using Stata‏ للمؤلفين Rabe-Hesketh and Skrondal‏ )2012( يقو e‏ 
odo‏ ج oll‏ الرسمية ف xt‏ ببرفامج سكاتا y‏ وكذلك ql jl‏ غير الوسمية 
التي يُطلق عليها gllamm‏ التي تقوم بإضافة قدرات لصياغة نماذج خطية 
Able‏ للتأثيرات المختلطة» لمزيد من المعلومات عن كيفية الحصول وتثبيت 
الملفات التنفيذية 200-5165 لهذه البرامج قم بطباعة الأمر -findit gllamm‏ 


أمثلة عن الأوامر : Example Commands‏ 





.xtmixed crime year || city: year 

يقوم بحساب انحدار التأثيرات المختلطة لمتغير crime‏ (الجريمة) على 

متغير year‏ (السنة) مع تقاطع عشوائي» وميل لكل قيمة من قيم المتغير city‏ 

(المدينة)» ولذا سوف نحصل على معدلات الجريمةء والتي هي عبارة عن 

تركيبة من الاتجاه العام (التأثيرات الثابتة) مع تباينات على ذلك الاتجاه 
(التأثيرات العشوائية) لكل مدينة. 


-xtmixed SAT parentcoll prepcourse grades || 
city:|| school: grades 


يقوم بصياغة نموذج التأثيرات المختلطة متعدد المستويات أو الهرمي 
متوقعاً نتائج SAT‏ للطلبة كدالة — : (1) تأثيرات ت ثابتة أو تأثيرات العينة 
بالكامل لمعرفة ما إذا كان والد أو والديّ الطلبة متخرّج من ALIS‏ وما إذا 
كان الطالب قد أخذ دورة إعداد ومعدل الطالب» )2( تقاطعات عشوائية تمثل 
تأثير المدينة التي بها المدرسةء )3( تقاطع عشوائي وميل لمُعامل معدل كل 
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طالب والذي قد يكون مختلفا من مدرسة لأخرى؛ كل الطلبة (المشاهدات) لهم 
علاقة متشابكة بالمدارسء والأخيرة لها علاقة بالمدن التي تقع بها. لاحظ 
الترتيب لأجزاء التأثيرات المختلطة في الأمر. 


.xtmixed y x1 x2 x3 || state: x3 
-estimates store A 
.xtmixed y x1 x2 x3 || state: 


.estimates store B 

.lrtest A B 

يقوم بحساب معدل الاحتمال لاختبار y'‏ لفرضية العدم التي تفترض بعدم 

وجود اختلاف في التناسب بين النموذج الأكثر تعقيد «A lauded‏ والذئ Gant‏ :ميلا 

على المتغير o3‏ والنموذج الأبسط B) B‏ موجود داخل 4) وهو لا يتضمن 

ميلا Wyte‏ على المتغير 3 هذا يصل لاختبار ما إذا كان الميل العشوائي 

على x3‏ ذا معنوية إحصائية. الترتيب في النموذجين اللذين تم تحديدهما في 

الأمر Irtest‏ ليس «Lege‏ إذا قمنا بطباعة 4 8 Irtest‏ فإن برنامج ستاتا سوف 
يتعامل بشكل صحيح مع هذه العملية معتبراً أن B‏ متداخل في A‏ 


.xtmixed y xl x2 x3 || state: x2 x3, reml 
nocons cov(unstructured) 


يقوم بحساب انحدار التأثيرات المختلطة للمتغير ر على التأثيرات الثابتة 
للمتغيرات التنبؤية 1× ,2+ ,3+ Lead‏ على التأثيرات العشوائية للمتغيرات x2,‏ 
x3‏ لكل قيمة من قيم المتغير estate‏ حيث يتم الحصول على التقديرات 
بواسطة الحد الأقصى للاحتمال المحدود. النموذج يُفترض ألا يكون له تقاطع 
عشوائي» ولا مصفوفة تغاير غير منتظمةء والتي يكون بها تباينات الت أثير 
العشوائي» وقيم التغاير كلها مقذرة بوضوح. 
.estat recov‏ 
بعد الأمر xtmixed‏ يقوم الأمر أعلاه بعرض مصفوفة التغاير- التباين 
المقدرة للتأثيرات Anil gall‏ 
-Predict re*, reffects p‏ 
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بعد أمر التقدير xtmixed‏ يقوم هذا الأمر بحساب أفضل تقديرات خطية 
غير المتحيزة (BLUPs)‏ لكل التأثيرات العشوائية في النموذج. التأثيرات 
العشوائية يتم حفظها كمتغيرات لها الأسماء التالية rel, re2‏ وهكذا. 
.predict yhat, fitted‏ 
بعد أمر التقدير xtmixed‏ يقوم الأمر أعلاه بحساب القيم المتوقعة للمتغير 
بره وللحصول على التوقعات من جزء التأثيرات المختلطة للنموذج فقط نقوم 
بطباعة predict yhat, xb‏ الخيارات predict GAY!‏ تقوم بإيجاد الأخطاء 
المعيارية للجزء الثابت (stap)‏ أو البواقي المعيارية .(rstan)‏ وللحصول على 
قائمة كاملة من أوامر ما بعد التقدير مع روابطها وكيفية تركيبها وخياراتهاء 
قم بطباعة الأمر 0 -help xtmixed‏ ش 
.xtmelogit y x1 x2 || state:‏ 
يقوم بحساب الانحدار اللوغاريتمي للتأثيرات الثابتة )0,1( للمتغير ر على 
المتغيرين x2, x]‏ مع التقاطعات العشوائية لكل مستوى من المتغير state‏ 
.predict phat‏ 
بعد أمر التقدير xtmelogit‏ يقوم الأمر أعلاه بحساب الاحتمالات المتوقعة 
من نموذج كامل (ثابت زائد عشوائي)» لمعرفة أوامر ما بعد التقدير الأخرى 
بالإضافة إلى قائمة ALIS‏ بخيارات الأمر predict‏ بما فيها بواقي بواسون 
(pearson)‏ وبواقى الانحراف (deviance)‏ للحصول على تفاصيل أكثر عن 
أوامر ما بعد التقديز وخياراتهاء قم بطباعة الأمر help xtmelogit‏ 
-postestimation‏ 


-xtmepoisson accidents xl x2 x3, exposure 
(persondays)|| season:|| port: , irr 


يقوم بتقدير نموذج بواسون للتأثيرات المختلطة للمتغير accidents‏ الذي 
يحسب حوادث قوارب صيد الأسماك. المتغيرات التنبؤية للتأثير الثابت - 
وهي خصائص كل قارب صيد على baa‏ — هي 1× o3, x2,‏ ويتم قياس 
التعرّض بعدد شخص/ يوم في البحر لذلك cca‏ نقوم بتضمين التقاطعات 
العشوائية لكل موسم season‏ أو سنة» والمدينة التي بها الميناء port‏ التي 
تتداخل مع المواسم» النتائج توضح مُعاملات التأثير الثابت كنسب لمعدل 
الحوادث (irr)‏ 
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-gllamm warming sex educ,i(region) 
family(binomial) link(ologit)adapt 


يقوم بحساب النموذج الكامن الخطي المعياري والمختلط. وفي هذا 
المثال» يتم حساب الانحدار اللوغاريتمي المرتب للتأثيرات المختلطة للمتغير 
الترتيبي warming‏ على المتغيرات التنبؤية للتأثير الثابت للمتغيرين «sex, educ‏ 
ويتم إدراج التقاطعات العشوائية لكل قيمة من قيم المتغير region‏ والتي تم 
تقديرها من خلال التربيع التكييفي. الخياران link() 5 familyQ‏ يمكنهما تحديد 
النماذج الأخرىء بما فيها اللوغاريتم متعدد الحدود والاحتمال واللوغاريتم 
التكميلي. الأمر gllamm‏ ليس من الأوامر الرسمية ببرنامج ستاتاء ولكنه 
متوافر على شبكة الإنترنت مجاناء قم بطباعة الأمر findit gllamm‏ للحصول 
على معلومات عن كيفية تحميله وتثبيته والملفات الضرورية الخاصة به» 
كتاب Rabe-Hesketh and Skrondal‏ )2012( يعطي تفاصيل 2s‏ « وأمثلة عن 
كيفية استخدام الأمر .gllamm‏ 


الاحدار م6 التقاطعات العشوائية :7 


Regression With Random Intercepts 


لشرح الأمر xtmixed‏ سوف fas‏ مع بيانات على مستوى Al gall‏ حيث 
إن البيانات تتعلق بالانتخابات الرئاسيّة بالولايات المتحدة لسنة 2004 (دراسة 
Robinson‏ 2005(. في هذه الانتخابات فاز جورج بوش daa)‏ على 7650.7 
من الأصوات) حيث هزم كلا من جون كيري )9648.3( ورالف نادر 
)%0.4(. السمة المثيرة في هذه الانتخابات كانت نمطها الجغرافي» حيث فاز 
كيري بولايات في الساحل الغربي والشمال الشرقي وحول البحيرات 
العظمىء بينما بوش فاز في كل الولايات الأخرى. دعم بوش كان قويا في 
المناطق الريفية» بينما الأضوات التي حصل عليها كيري تركزت في المدنء 
ملف البيانات 2004 election‏ يحتوي على نتائج الانتخابات والمتغيرات التي 
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تغطي مقاطعات الولايات المتحدة» هناك متغير نوعي يحتوي على تقسيمات 
السكان (cendiv)‏ والذي يُقسّم الولايات المتحدة إلى 9 مناطق جغرافية. كما أن 
المتغيرات تتضمن العدد الكلي للأصوات (votes)‏ ونسبة أصوات بوش هي 
Lain (bush)‏ لوغاريتم الكثافة السكانية (logdens)‏ والذي يُعتبر كمؤشر على 
ريفية المنطقةء والمتغيرات الأخرى لنسبة سكان المقاطعة التي تنتمي إلى 
الأقليات العرقية (minority)‏ أو البالغين الحاصلين على درجة جامعية 








-(colled) 
.use C:\data\election_2004i.dta: clear 
. describe 
Contains data from C:\data\election_2004i.dta 
obs: 3,054 US counties -- 2004 election (Robinson 2005) 
Vars: 1i 2 Jul 2012 06:11 
size: 219,888 
Storage display value 
variable name type format label variable label 
fips long  $9.0g FIPS code 
state str20 %20s State name 
state2 Str2  $9s State 2-letter abbreviation 
region byte %9.0g region Region (4) 
cendiv byte — $15.0g division Census division (9) 
county str24 $24s County name 
votes float $9.0g Total f of votes cast, 2004 
bush float %9.0g * votes for GW Bush, 2004 
logdens float %9.0g logl0(people per square nile) 
minority float $9.0g $ population minority 
colled float $9.0g % adults >25 w/4* years college 





Sorted by: fips? 


نسبة المقترعين لصالح بوش انخفضت Cual 5 UIS‏ كثافة السكان كما هو 
معروض في شكل الانتشار وخط الانحدار بالشكل (1.13)؛ كل نقطة تمشل 
مقاطعة واحدة من 3,054 مقاطعة. 


.graph twoway scatter bush logdens, msymbol (Oh) 
|| 1fit bush logdens, lwidth(medthick) 
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o 
e 





2 
log10(people per square mile) 





© % votes for GW Bush, 2004 Fitted values 


الشكل )1.13( 


النسخة المطوّرة لهذا الشكل البياني الذي يمثل الكثافة السكانية مع 
الانتخابات تظهر في الشكل (2.13). القيم اللوغاريتمية على المحور الأفقي 
تم توصيفها (1 تصبح "10" 2 تصبح "100" وهكذا) وذلك لجعل هذه القيم 
قابلة للقراءة بسهولة. وباستخدام voles‏ وزان تكرارية لشكل الانتشار مما 
جعل العلامات بمنطقة شكل الانتشار جزءًا فقط إلى العدد الكلي للأصوات 
الانتخابية» حيث هناك فرق واضح بين المقاطعات التي تكون بها ARES‏ سكان 
كبيرة أو صغيرة: وإذا لم يتم ذلك فإن التحليل في هذا الفصل لن يستخدم 
الأوزان» موك 'تركن .هنا على اتجاهات القصويت بدلا من الأفراد :في هذه 
المقاطعات. 
.graph twoway scatter bushlogdens [fw-votes],‏ 
msymbol (Oh)‏ 
1fit bush logdens, lwidth(medthick)‏ || 
xlabel(-1 "0.1" 0 "1" 1 "10" 2 "100" 3‏ , || 
grid) legend(off)‏ ,"10,000" 4 "1,000" 
xtitle("Population per square mile")‏ 


= 


ytitle("Percent vote for GW Bush") 
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الشكل (2.13) 


كما يؤكد الشكل )2.13( فنسبة التصويت لصالح چورچ بوش تميل 
لتكون أقل في المناطق ذات الكثافة السكانية العالية والمقاطعات المتحضرة 
كما أنها تميل Cad‏ لتكون أقل في المقاطعات التي بها نسبة كبيرة من 
الأقليات العرقية أو نسبة أكبر من البالغين الذين يحملون Sla $a‏ جامعياً. 


.regress bush logdens minority colled 



































Source Number of obs - 3041 
F( 3, 3037) = 345.39 

Model 122345.617 3 40781.8725 Prob» F = 0.0000 
Residual 358593.826 3037 118.075017 R-squared - 0.2544 
Adj R-squared = 0.2537 

480939.443 3040 158.203764 Root MSE = 10.866 


bush Coef. Std. Err. t P»|t| [95$ Conf. Interval) 







logdens -5.457462 - 3031091 -18.00 0.000 -6.051781 -4.863142 


minority -.251151 .0125261 -20.05 0.000 -.2157115 -.2265505 
colled -.1811345 .0334151 -5.42 0.000 -.246653 -.115616 
_cons 75.78636 .5739508 74.66099 76.91173 
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في صيغ النموذج المختلط» نقوم بتقدير نموذج يحتوي على تأثيرات 
ثابتة فقط» ويكون التقاطع والمعاملات تفسر العينة ككل. ونفس نموذج 
التأثير ات الثابتة يمكن تقديرها باستخدام xtmixed ye!‏ مع نفس تركيبة 


الأمر السابق. 

.xtmixed bush logdens minority colled 
Mixed-effects ML regression Number of obs = 3041 
Wald chi2(3) = 1037.53 
Log likelihood = -11567.783 Prob > chi2 = 0.0000 







bush Coef. Std. Err. z P»|z| [95$ Conf. Interval] 










logdens -5.457462 - 3029097 -18.02 0.000 -6.051154 -4.86377 
minority -.251151 .0125179 -20.06 0.000 -.2756856 -.2266164 
colled -.1811345 .0333931 -5.42 0.000 -.2465838 -.1156852 


75.78636 5735732 74.66217 76.91054 









_cons 

















Random-effects Parameters Estimate Std. Err. {95% Conf. Interval] 








sd (Residual) 10.85908 .1392419 10.58958 11.13545 


الاحتمالية القصوى (ML)‏ هي iib‏ التقدير الافتراضية للأمر «xtmixed‏ 
ولكن قد يتم تحديده بشكل خاص مع خيار anb‏ أو بشكل آخر فإن الخيار 
remi‏ يمكن استخدامه لتقدير الاحتمالية القصوى المقيّدة» وللحصول على قائمة 
بالتقديرات والخيارات المتعلقة بها قم بطباعة الأمر help xtmixed‏ 

النمط أو الاتجاه الجغرافي للتصويت يمكن رؤيته في الخرائط بألوان 
زرقاء وحمراء لهذه الانتخاباتء والتي لم يتم حسابها بواسطة نموذج 
التأثيرات الثابتة أعلاه» والذي يفترض بأن التقاطع وقيم الميل هي نفسها لكل 
1 مقاطعة في هذا التحليل» الطريقة الأخرى لصياغة نموذج الاتجاه 
نحو نمط انتخاب مختلف في أجزاء مختلفة من المقاطعة (ولتخفيض مشكلة 
أخطاء الارتباط المكانية) تتم من خلال السماح لكل التقسيمات السكانية 
التسعة لتأخذ تقاطعها العشوائي الخاص بهاء وبدلا من نموذج الارتباط 
(التأثيرات الثابتة) المعتاد مثل: 

Y, = Bo + BX, + Box, + Bax. e, [1.13] 
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يمكننا تضمين ليس فقط مجموعة مُعاملات م التي تفسّر كل المقاطعات؛ 
وإنما أيضا تقاطع عشوائي م» يتغير من تقسيم سكاني إلى آخر. 

yy = fs + By + ByXqy + Byxayt €; [2.13] 

المعادلة ]2.13[ تصور قيمة المتغير US) y‏ مقاطعة i‏ وكل تقسيم سكاني j‏ 
كدالة لتأثيرات المتغيرات x1‏ ,2× ,3× والتي هي نفسها لكل التقسيمات. التقاطع 
العشوائي uy‏ يسمح لاحتمالية أن تكون نسبة متوسط الانتخاب لجورج بوش 
أعلى أو أقل بانتظام بين المقاطعات لبعض التقسيمات» هذا يبدو مناسباً 
لانتخابات الولايات المتحدة عند الأخذ بالاعتبار الأنماط الجغرافية dal ol‏ 
كما يمكننا تقدير نموذج مع تقاطعات عشوائية لكل تقسيم سكاني» وذلك 





بإضافة جزء من تأثيرات عشوائية جديدة إلى الأمر 0©<نم)»: 


.xtmixed bush logdens minority colled || cendiv: 


Performing EM optimization: 
Performing gradient-based optimization: 


-11339.79 
-11339.79 (backed up) 


Iteration 0: log likelihood 
Iteration 1: log likelihood 


Computing standard errors: 


Mixed-effects ML regression Number of obs 


= 3041 

Group variable: cendiv Number of groups = 9 
Obs per group: min = 67 

avg = 337.9 

max = 616 

Wald chi2(3) = 1161.96 

Log likelihood = -11339.79 Prob > chi2 = 0.0000 








{95% Conf. Interval) 













logdens -4.52417 3621775 0. -5.234025 -3.814316 
minority -.3645394 .0129918 -28.06 0.000 -.3900029 -.3390758 
colled -.0583942 .0357717 -1.63 0.103 -.1285053 .011717 
—cons 0.000 67.59682 76.58929 


72.09305 2.29404 31.43 















Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] 











cendiv: Identity 







sd( cons) 6.617137 1.600468 





4.119007 10.63036 





sd(Residual) 





10.00339 -1284657 9.754742 10.25837 


LR test vs. linear regression: chibar2(01) = 455.99 Prob >= chibsr2 = 0.0000 
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الجزء السابق من جدول مخرجات xtmixed‏ يعرض جزء التأثيرات 
الثابتة للنموذج. هذا النموذج يقوم بتطبيق تسعة تقاطعات متفرقة» حيث يوجد 
هناك تقاطع لكل تقسيم سكائيء ولكن لم يتم تقديرها +-باشرة؛ وبدلاً من ذلك 
فإن الجزء السفلي من الجدول يعطي الانحراف المعياري المقذر للتقاطعات 
العشوائية (6.62) مع خطأ معياري (1.60) وفترة ثقة 9695 لذلك الانحراف 
المعياري» وبذلك يصبح النموذج كما يلي: 


bush, = 72.09 - 4.52logdens;;- 0.36minority,,— 0.06colled;* uy + € i [3.13] 


13 ظهر الانحراف المعياري ل m‏ يختلف جوهرياً عن الصفرء فيمكننا 
أن نستنتج بأن هذه التقاطعات تتنوع من مكان لآخرء وهذا ما ييدو عليه 
الوضع هنا. حيث إن الانحراف المعياري أكبر من أربعة أخطاء معيارية من 
الصفرء وقيم هذا الانحراف جوهرية (6.62 نقطة مئوية) للمتغير التابع وهو 
نسبة التصويت لجورج بوشء اختبار نسبة الأرجحية العظمى يظهر في آخر 
سطر بجدول المخرجات» والذي يؤكد بأن نموذج التقاططع العشوائي 
شهد Mas yy bi‏ عن أي نموذج انحدار خطي مع تأثيرات ثابتة فققط 
-(p = 0.0000)‏ 

بالرغم من أن الأمر Y xtmixed‏ يحسب التأثيرات العشوائية بطريقة 
مباشرة» ولكن يمكننا الحصول على أفضل توقعات خطية غير متحيزة 
(BLUPS)‏ للتأثيرات العشوائية من خلال الأمر predict‏ الأوامر أدناه تقوم 
بإنشاء متغير جديد randintü awl‏ يحتوي على التقاطعات العشوائية المتوقعةء 
ثم يقوم بإنشاء رسم بياني لكل تقاطع عشوائي مع كل تقسيم سكاني في الرسم 
البياني للأعمدة (الشكل 3.13). 

-predict randint0, reffects 


graph hbar (mean) randint0, over(cendiv) 
ytitle("Random intercepts by census division") 
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New England | BENNEEEEEEEEEEEEEEEEEN 





Middle Atlantic Ei 
E North Central EN 
W North Central 
South Atlantic (I ae 2-1 
E South Central ct 
W South Central أو :+ ڪڪ ا‎ 
Mountain EN 
Pacific E 
a Rendon i EDE by ais division = 
(3.13) الشكل‎ 


الشكل (3.13) يوضح بأنه عند أي مستوى من مستویات logdens,‏ 
minority, colled‏ تسبة الأصو ات التي ذهبت لصالح بوش كانت بمتوسط 15 
نقطة أقل في مقاطعات نيو إنجلاند New England‏ وأكثر من 8 LLG‏ في 
المقاطعات الوسطى في الجنوب الغربي (مقاطعات Arkansas. Louisiana,‏ 
(Oklahoma, Texas‏ مقارنة مع منتصف الطريق وهو تقسيم المنطقة الوسطى 
للشمال الغربي. 


Random Intercepts and Slopes : واطيول العشوائية‎ oleblaill 


في الشكل )2.13( رأينا - بأنه وبصفة عامة - أن نسبة الناخبين لصالح 
M RP adi‏ او وي اي و العشوائى 

فى الجزء السابق وافق على هذه النتيجة النتيجةء وسمح للتقاطعات بأن تتغير حسب 
الستاطق . ولكن ماذا لو كان ميل العلاقة بين الكثافة والانتخاب يتغير أيضاً 
بتغير المناطق؟ نظرة سريعة على شكل الانتشار لكل منطقة (الشكل 4.13( 
يعطينا مبررا للشك بأن ذلك قد يحدث. 
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.graph twoway scatter bush logdens, msymbol (Oh) 
|| 1£it bush logdens, lwidth(medthick) 
|| , xlabel(-1(1)4, grid) ytitle("Percent 
vote for GW Bush") 
by(cendiv, legend(off) note("")) 
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الشكل (4.13) 


أصوات بوش تنخفض بدرجة كبيرة مع زيادة الكثافة السكانية في 
المناطق الوسطى والشمالية الغربية ومنطقة المحيط الهادئ. ولكن يبدو أن 
هناك علاقة ضعيفة في المناطق الوسطى الشمالية الشرقية» وحتى هناك تأثير 
موجب في المناطق الوسطى الجنوبية الشرقية. معامل التأثير الثابت السالب 
للمتغير Jogdens‏ في النموذج السابق كان متوسطا لهذه الاتجاهات المنخفضة 
ond‏ و الما تقد مهار 

يمكن إنشاء نموذج مختلط يتضمن قيم ميل عشوائية (uy)‏ للمتغير 
التنبؤي ,+ والتقاطعات العشوائية (uy)‏ لكل مجموعة من مجموعات زروتكون 
صيغته العامة كما يلي: 


Y^ Bo + Bixiy + Boxy + Bea, + uo, Fu, + e, ` [4.13] 
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ولتوضيح مثل هذا النموذج› سوف نقوم بإضافة متغير تنبؤي logdens‏ 
لجزء التأثير المختلط بالأمر .xtmixed‏ 


.xtmixed bush logdens minority colled || cendiv: 
logdens f 


Performing EM optimization: 
Performing gradient-based optimization: 


Iteration 0: log likelihood - -11298.734 
Iteration 1: log likelihood - -11298.734 


Computing standard errors: 


Mixed-effects ML regression Number of obs = 3041 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 67 

avg - 337.9 

max - 616 

Wald chi2(3) = 806.25 

Log likelihood = -11298.734 ' Prob » chi2 = 0.0000 













Coef. Std. Err. [95$ Conf. Interval) 










logdens -3.310313 1.114965 -2.97 0.003 -5.495605 -1.125021 
minority -.3616886 .0130709 -27.67 0.000 -.387307 -.3360702 
colled -.1173469 .0360906 -3.25 0.001 -.1880833 -.0466105 


23.73 64.32885 75.91305 






70.12095 2.955209 





-cons 








Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval] 
cendiv: Independent 

sd(logdens) 3.113575 .8143897 1.86474 5.198768 

sdí. cons) B.5913 2.232214 5.162945 14.29619 

sd (Residual) 9.825565 .1264176 9.580889 10.07649 

LR test vs. linear regression: chi2(2) = 538.10 Prob » chi2 - 0.0000 


Note: LR test is conservative and provided only for reference. 


وكما هو معتاد فإن التأثيرات العشوائية لم يتم تقديرها مباشرة» وبدلا 
من «ell‏ فإن جدول مخرجات الأمر xtmined‏ يعرض تقديرات لانحرافاته ا 
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المعيارية. الانحراف المعياري COLL‏ لوغاريتم الكثافة هو 3.11 - وهو 
تقريبا أبعد أربع مرات من الأخطاء المعيارية (0.81) عن الصفر - مما 
يشير إلى وجود تباين ذي معنوية بين تقسيمات السكان في مُعاملات الميلء 
هذا AS‏ لال سوقت derat‏ يشل ساسم سن كلدل gd‏ معدل (scs A‏ 
ولإجراء هذا الاختبار» سوف نقوم بإعادة تقدير تقاطع النموذج ويتم Bis‏ 
هذا التقدير باسم 4 (اسم تم اختياره عشوائياً) ثم نقوم بإعادة تقدير ميل 
وتقاطع النموذج وحفظ هذه التقديرات (B aul‏ وأخيرا نقوم بحساب اختبار 
معدل الأرجحية العظمى لمعرفة ما إذا كان 8 يتناسب بدرجة أفضل من 
تناسب eA‏ وهذا ما حدث Sai‏ في هذا المثال )0.0000 = م). ولذا فإننا نستنتج 
بأن إضافة قيم ميل عشوائية يقوم بتطوير النموذج بصورة كبيرة. 


.quietly xtmixed bush 1090625 minority colled 
|| cendiv: 


.estimates store A 

-quietly xtmixed bush logdens minority colled 
|| cendiv: logdens 

-estimates store B 

.lrtest A B 


Likelihood-ratio test LR chi2(1) = 82.11 
(Assumption: A nested in B) Prob» chi? = 0.0000 


Note: The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
Parameter space. If this is not true, then the reported test is conservative. 


مخرجات الأمر Irtest‏ تحذرنا بأن هناك "افتراضاً أن كل فرضيات العدم 
ليست ضمن حدود مساحة المعلمية". وبخلاف ذلك» فإن الاختبار الناتج سوف 
يكون محافظاً على هذه الحدود. GI‏ الملاحظتين تشيران إلى نفس القضية 
الإحصائية» فالتباين لا يمكن أن يكون أقل من الصفر. ولذا فإن فرضية العدم 
القائلة بأن التباين يساوي صفراً تقع ضمن حدود المساحة المعلمية. في هذه 
الحالة الاحتمالية التي نتجت من اختبار معدل الأرجحية العظمى تمثل حدا 
/على "محافظاً على حدود" الاحتمال الواقعي» الأمر GAS xtmixed‏ هذا 
الوضع بشكل unb‏ وهذا لا يمكن القيام به باستخدام الأمر Artest‏ 
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النموذج السابق يفترض أن قيم الميل والتقاطعات العشوائية غير 
مترابطة» وهذا كاف إضافة الخيار cov(independent)‏ الذي يُحدد uS ý‏ 4 
التباين المصاحب. الاحتمالات الأخر 5( تتضمن cov(unstructured)‏ والذي 
يسمح بتوضيح التباين المصاحب الذي لايساوي صفرا بين التأثيرات 
العشوائية. . 


.xtmixed bush logdens minority colled 
|| cendiv: logdens, cov(unstructured) 


Performing EM optimization: 


Performing gradient-based optimization: 


Iteration 0: log likelihood = -11296.31 
Iteration 1: log likelihood = -11296.31 (backed up) 
Computing standard errors: 
Mixed-effects ML regression Number of obs = 3041 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 67 
avg = 337.9 
E max = 616 
Wald chi2(3) z 799.68 
Log likelihood = ~-11296.31 Prob » chi2 = 0.0000 









Coef. Std. Err. z P>|z| [95$ Conf. Interval] 











-3.150009 -.858175 





logdens 1.169325 -5.441844 


minority -.3611161 .0130977 -27.57 0.000 -.3867872 -.3354451 
colled -.1230445 .0361363 -3.41 0.001 -.1938704 -.0522186 
cons 69.85194 3.168479 63.64184 76.06204 












Random-effects Parameters Estimate Std. Err. [95$ Conf. Interval] 
cendiv: Unstructured 

sd(logdens) 3.282749 8547255 1.970658 5.468447 

sd(, cons) 9.240389 2.402183 5.551459 15.3806 

corr(logdens, cons) 7.675152 .1958923 -.909687 -.1140965 

sd(Residual) 9.823658 1263468 9.579118 10.07444 

LR test vs. linear regression: chi2(3) = 542.95 Prob » chi2 - 0.0000 


Note: LR test is conservative and provided only for reference. 
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الترابط المقذر بين الميل العشو ائي للمتغير logdens‏ و التقاطع العشو ائي 
معدل الأرجحية العظمى يتفق مع القول بأن السماح Nag:‏ الترابط ينتج عنه 
تطور دو معنوية )0.277 = (p‏ في النموذج الحالي عن النموذج السابق. 


.egtimates store C 
.lrtest B C 


Likelihood-ratio test LR chi2(1) 4.85 
(Assumption: B nested in C) Prob > chi2 = 0.0277 


النموذج الحالي هو: 


bush, = 69.85 — 3.15 logdens, — 0.36 minority, — 0.12 colledy + uo 


uylogdens, + €, [5.13]‏ + 
إذن ما الذي تقوم به قيم الميل لربط التصويت مع الكثافة لكل تقسيم 
سكاني؟ مرة أخرى يمكننا الحصول على قيم التأثيرات العشوائية (تم تسميتها 
هنا randint]‏ و (randslol‏ من خلال الأمر «predict‏ فالبيانات التي نقوم 

باستخدامها الآن أصبحت تحتوي على مجموعة متغيرات جديدة. 
.predict randslolirandinti1, reffects‏ 


.describe 
Contains data from C:\data\election_2004i.dta 

obs: 3,054 US counties -- 2004 election (Robinson 2005) 
vars: 17 23 Feb 2014 01:37 

size: 265,698 

storage display value 
variable name type format label variable label 
= 

fips long $9.0g FIPS code 
state str20 5 State name 
state2 str2 49s State 2-letter abbreviation 
region byte 59 . و0‎ region Region (4) 
cendiv byte $15.0g division Census division (9) 
county str24 45 County name 
votes float %9.0g Total # of votes cast, 2004 
bush float %9.0g % votes for GW Bush, 2004 
logdens float %9.0g loglO(people per square mile) 
minority float %9.0g * population minority 
colled float %9.0g * adults >25 w/4+ years college 
randintO float %9.0g BLUP r.e. for cendiv: . cons 
.est.C byte 98 . 09 esample() from estimates store 
-est A byte $8.0g esample() from estimates store 
-est B byte 58. 09 esample() from estimates store 
randslol float %9.0g BLUP r.e. for cendiv: logdens 
randintl float %9.0g BLUP r.e. for cendiv: cons 


f X Re ELS SS MS 
Sorted by: fips es 


Note: dataset has changed since last saved 
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مُعاملات الميل العشوائي تتراوح من 5.45- للمقاطعات في تقسيم 
المنطقة الوسطى الشمالية الغربية W North Central‏ إلى 4.49+ في المنطقة 
الوسطى الجنوبية الشرقية .E South Central‏ 


.table cendiv, contents (mean randslol1 mean 
randint1) ` 











Census division 
(9) 






meaní(randslol) mean(randinti) 








.8396833 -16.95975 
-0018003 -2.339407 













New England 
Middle Atlantic 


E North Central 3.510326 -8.810173 
W North Central -5.453928 7.912671 
South Atlantic 1.870723 2.622947 
E South Central 4.493841 -4.029463 
W South Central -.5490148 10.37175 
Mountain -1.73396 6.80135 


4.430075 





-2.979471 





Pacific 


لتوضيح العلاقة بين التصويت والكثافة السكانية يمكننا إعادة تنظيم 
المعادلة [5.13] بدمج قيم الميل العشوائي والثابت للمتغير ‘logdens‏ 


bush; 69.85 + (u,-3.15) logdens;; — 0.36minority, — 0.12colled;; + ug + € y 16.13] 


بعبارة cg yal‏ الميل لكل تقسيم سكاني يساوي ميل التأثير الثابت للعينة 
بالكامل زائداً ميل التأثدر العشوائي لكل تقسيم سكاني. Wiad‏ شمن ALi‏ 
dedi of an coll n gle ted‏ الموحد هي 6.37- = 3.22 - 3.15« 

قيم الميل الموحدة التسعة تم حسابها وتمثيلها Lily‏ في الشكل )5.13( 
.gen slopel = randslol + _b[logdens]‏ 


-graph hbar (mean) Slopel1, over(cendiv) 


ytitle("Change in % Bush vote, with each 
tenfold increase in density") 
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New England 
Middle Atlantic 
E North Central 
W North Central 
South Atlantic 

E South Central 
W South Central 
Mountain 


Pacific 





-8 -6 4 -2 0 2 
Change in % Bush vote, with each tenfold increase in density 


الشكل )5.13( 


الشكل )5.13( يعرض كيف أن التدرج بين الريف والحضر في السلوك 
الانتخابي يختلف من مكان لآخرء في المقاطعات الوسطى الشمالية الغربية 
والمناطق الجبلية والمطلة على المحيط الهادئ كانت نسبة المصوتين لبوش 
انخفضت بشكل حاد كلما زادت الكثافة السكانيةء LA‏ في المناطق الوسطى 
الشمالية الشرقية والوسطى الجنوبية الشرقية فقد كانت النسبة في الاتجاه 
الآخرء حيث زادت أصوات بوش بدرجة بسيطةء قيم الميل الموحدة في 
الشكل (5.13) تشابه بشكل عام تلك التي تظهر في الشكل (4.13) ولكن لا 
تتطابق بالضبط لأن قيم الميل الموحدة (المعادلة [6.13] أو الشكل 5.13) تم 
Leal‏ تعديلها بالنسبة لتأثير الأقليات وخريجي الجامعات. في الجزء التالي 
سوف نقوم بدراسة ما إذا كانت هذه التأثيرات لها مكونات عشوائية. 


Multiple Random Slopes : 031235 العشوائية‎ dubl قيم‎ 
يمكننا‎ logdens, minority, colled لتحديد المُعاملات العشوائية للمتغيرات‎ 


ببساطة إضافة أسماء هذه المتغيرات إلى جزء التأثيرات العشوائية لمر 
oitmixed‏ لغرض إجراء اختبارات المقارنة. لاحقا سوف نقوم بحفظ نتائج 
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التقدير باسم full‏ وهناك بعض التفاصيل المكررة ثم إهمالها في المخرجات 


التالية: 
.xtmixed bushlogdens minority colled‏ 
cendiv: logdens minority colled‏ || 
Performing EM optimization:‏ 
Performing gradient-based optimization:‏ 
Iteration 0: log likelihood = -11184.804‏ 
Iteration 1: log likelihood = -11184.804‏ 
Computing standard errors:‏ 
Mixed-effects ML regression Number of obs = 3041‏ 
Group variable: cendiv Number of groups = 9‏ 
Obs per group: min = 67‏ 
avg = 337.9‏ 
max = 616‏ 
Wald chi2(3) = 52.49‏ 
Log likelihood = -11184.804 Prob > chi2 = 0.0000‏ 





[95% Conf. Interval] 















logdens -2.717128 1.373684 -5.409499 -.0247572 
minority -.3795605 .0560052 -6.78 0.000 -.4893286 -.2697924 
colled -.1707863 .1727142 -0.99 0.323 -.5094175 .167845 


70.86653 3.435918 64.13225 77.6008 









_cons 














Estimate Std. Err. (95% Conf. Interval) 





Random-effects Parameters 





cendiv: Independent 


sd(logdens) 3.868421 . 9 2.350564 6.366421 
sd(minority) .153172 .0439569 .0872777 .2688161 
sd(colled) .5032414 .1241234 .310334 .8160625 
sd(. cons), 10.01157 2.547813 6.079707 16.48625 










sd(Residual) 9.375994 .1209753 9.141859 9.616124 





LR test vs. linear regression: chi2(4) = 765.96 Prob » chi2 - 0.0000 


Note: LR test is conservative and provided only for reference. 


.estimates store full 
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باعتبار نموذج full‏ كخط أساسي» فإن اختبارات معدل الأرجحية 
العظمى تحدد بأن المعاملات العشوائية للمتغيرات logdens, minority, colled‏ 
كل منها لها اختلاف ذو معنوية إحصائية. ولذا فإن هذه الاختلافات يجب 
الاحتفاظ بها بالنموذج» فمثلا لتقييم التأثيرات العشوائية للمتغير colled‏ فإننا 
نقوم بتقدير نموذج جديد بدونها (rocolled)‏ ثم نقارن ذلك النموذج مع نموذج 
Lal «full‏ نموذج 4 يتناسب بطريقة أسوأ بكثير )0.0000 (p‏ من نموذج 
(CENTER YT,‏ 


-quietly xtmixed bush logdens minority colled 
|| cendiv: logdens minority 

.estimates store nocolled 

.lrtest nocolled full 


Likelihood-ratio test LR chi2(1) 197.33 


(Assumption: nocolled nested in full) Prob > chi? = 0.0000 


Note: The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
parameter space. If this is not true, then the reported test is conservative. 


خطو ات متشابهة مع نموذجين آخر ين -(nominority  nologdens)‏ 
واختبارات معدل الأرجحية العظمى توضح بأن نمودج Lai full‏ يتناسب 
بشكل أفضل grew‏ من النماذج التي كانت بدون مُعامل عشوائي للمتغير 
al logdens‏ بدون مُعامل عشوائي للمتغير minority‏ 

-quietly xtmixed bush logdens minority colled 
|| cendiv: minority colled 

.egtimates store nologdens 

.lrtest nologdens full 


Likelihood-ratio test LR chi2(1) = 124.87 
(Assumption: nologdens nested in full) Prob > chi2 = 0.0000 


Note: The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
parameter space. If this is not true, then the reported test is conservative. 


يمكننا التحقق من أن.تفاصيل كل هذه التأثيرات العشوائية أو التأثيرات 
المدمجة التي ظهرت في النتائج من خلال حسابات وخطوط لتلك التي تم 
عرضها سابقا i‏ الشكل )13 .45 
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بحوث النماذج المختلطة في العادة تركز على التأثيرات الثابتة مع 
التأثير ات العشوائية والتي يتم إدراجها لتمثل عدم التجانس heterogeneity‏ في 
البيانات وليس لأي أسباب موضوعية أخرى. فعلى سبيل «JU Sall‏ التحاليل 
التي قمنا بها حتى الآن أظهرت بأن الكثافة السكانية ونسبة الأقليات ونسبة 
خريجي الجامعات يُمكنها أن تتنبأ بنمط التصويت في المقاطعة حتى بعد 
الأخذ في الاعتبار الاختلافات الإقليمية في متوسط الأصوات والاختلافات 
الإقليمية في الكثافة وخريجي الجامعات. ومن ناحية أخرىء فإن التأثيرات 
العشوائية هي نفسها لها أهمية. ولمعرفة كيف أن العلاقة بين التصويت 
ونسبة خريجي الجامعات (نسبة الأقليات أو لوغاريتم الكثافة السكانية) يختلف 
بين التقسيمات السكانية فيمكننا أن نتوقع التأثيرات العشوائية من خلال حساب 
التأثير الكلي. هذه الخطوات تم شرحها للتأثير الكلي لمتغير colled‏ على 
النموذج أدناه بالكامل» وتمثيلها Waly‏ في الشكل (6.13). 

quietly xtmixed bush logdens minority colled 

|| cendiv: logdens minority colled 

.predict relogdens reminority recolled re cons, 


reffects 
.describe relogdens-re cons 


storage display value 
variable name type format label variable label 
relogdens float %9.0g BLUP r.e. for cendiv: logdens 
reminority float %9.0g BLUP r.e. for cendiv: minority 
recolled float %9.0g BLUP r.e. for cendiv: colled 
re_cons float %9.0g BLUP r.e. for cendiv: _cons 


-generate tecolled = recolled + _b[colled] 
.label variable tecolled "random + fixed effect 
of colled" , 

.,table cendiv, contents (mean  recolled mean 
tecolled) 


622 الإحصاء مع برنامج ستاتا 














Census division 
(9) 





mean(recolled) mean(tecolled) 











New England .2411761 .4119623 





Middle Atlantic -.0849539 -.2557401 
E North Central -.0682224 -.2390087 
W North Central .4122158 .2414296 
South Atlantic -.1243222 -.2951084 
E South Central .4856058 .3148195 
W South Central .9054216 .7346353 
Mountain -.7355713 -.9063575 








.5489974 





Pacific .7197837 





.graph hbar (meen) tecolled, over(cendiv) 
ytitle("Change in % Bush vote, per 1 
increase in college graduates") 


a? 


New England 
Middle Atlantic 
E North Central 
W North Central 
South Allantic 

E South Central 
W South Central 
Mountain 


Pacific 





-1 -5 0 5 1 
Change in % Bush vote, per 1% increase in college graduates 


الشكل )6.13( 


الشكل )6.13( يعرض ER‏ سبب التطور الكبير الذي حدث في النموذج 
(p = 0.0000)‏ بعد إضافة ميل عشوائي للمتغير colled‏ التأثيرات الكلية للمتغير 
6 على أصوات بوش تتراوح من سالب بدرجة كبيرة (نسبة أصوات بوش 
منخفضة في المقاطعات التي بها خريجو جامعات أكثر) في الجبل Mountain‏ 
(0.91-) والمحيط Pacific cull!‏ (0.72-) ذات الكثافة السكانية إلى بسيطة 
هذا وغير ملحوظة في مناطق جنوب المحيط الأطلسي South Atlantic‏ أو 
المنطقة الوسطى الشمالية الغربية W North Central‏ ثم إلى موجبة بدرجة كبيرة 
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)0.73*( في المناطق الوسطى الجنوبية الغربية W South Central‏ حيث 
أصوات بوش كانت مرتفعة بدرجة كبيرة في تلك المقاطعات التي بها خريجو 
AALS MERC ES PEE lead‏ :التسكانية ونحسية CLAY‏ 
والتأثيرات الإقليمية الأخرىء إذا قمنا بتقدير تأثير ثابت للمتغير colled‏ فإن 
النموذج سوف يقوم بكفاءة بحساب متوسط إلتأثيرات السالبة التي تقترب من 
الصفرء والتأثيرات العشوائية الموجبة للمتغير colled‏ في معامل ثابت موجب 
أسبوعي واحدء ويكون المعامل بالضبط 0.18- في انحدارات التأثيرات الثابتة 
الاثنين التي بدأنا بها في هذا الفصل. l‏ 

الأمثلة التي رأيناها حتى الآن تم التعامل معها بشكل ناجح بواسطة 
الأمر extmixed‏ ولكن هذا ليس هو الوضع دائماء فتقدير نموذج ثابت يمكن 
أن يفشل في المعالجة لعدة أسباب Lage‏ إلى تكرار"عدم الانحناء" أو "esl AW"‏ 
أو رسائل خطأ حول Hessian‏ أو حسايات الأخطاء المعيارية. دليل المستخدم 
Longitudinal/Panel Data Reference Manual‏ يُناقش كيفية تشخيص ومعالجة 
مشاكل التقارب «convergence‏ والسبب المتكرر يبدو هو اقتر E‏ مكونات 
تباين النماذج من الصفز مثل المعاملات العشوائية التي لا تتباين بدرجة 
كبيرة أو لها تباين منخفض. في مثل هذه الحالات» فإن المكوننات المسببة 
لهذه المشكلة يمكن استبعادها بدرجة معقولة. 


Nested Levels : أطسئويات اطتشابكة‎ 


إنماذج التأثيرات الثابتة يمكن تضمينها أكثر من مستوى متشابك واحد. 
فمثلا المقاطعات في بيانات الانتخابات ليست متشابكة فط مع تقسيمات 
السكان» ولكنها lad‏ مع الو UY‏ والتي هي متشابكة مع تقسيمات السكان, 
هل التأثيرات العشوائية موجودة فقط عند مستوى تقسيمات السكان وأيضا 
عند مستويات أقل من الولايات؟ الأمر Jia ea xtmixed‏ هذه النماذج 
الهرمية. فأجزاء التأثيرات العشوائية الإضافية تم إضافتها للأمر مع وحدات 
(متشابكة) أصغر على التو الي إلى اليمين. التحليل التالئ يحدد التقاطعات 
العشو ائيةء وقيم الميل في المتغيرات التنبؤية الثلاثة لكل تقسيم سكاني» is].‏ 
التقاطعات العشوائية» وقيم الميل لنسبة خريجي الجامعات colled‏ لكل و لاية. 

-xtmixed bush 1093628 minority colled 
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RR Mc‏ ر apa rai c ue d‏ 


cendiv: logdens minority colled 
state: colled 


Performing EM optimization: 





Performing gradient-based optimization: 


Iteration 0: log likelihood = -10719.828 
Iteration 1: log likelihood -10719.821 
Iteration 2: log likelihood - -10719.821 


Computing standard errors: 


Mixed-effects ML regression Number of obs = 3041 








No. of Observations per Group 


Group Variable Groups Minimum Average Maximum 








cendiv 
state 





68.85 
0.0000 


Wald chi2(3: 
Log likelihood - -10719.821 Prob » chi2 







bush Coef. Std. Err. z P» |z| (95% Conf. Interval] 








logdens -2.473536 -4.426511 -.5205616 









.996434; 


minority -.4067648 .0533714 -7.62 0.000 -.5113709 -.3021588 
colled -.1787849 .1298313 -1.38 0.168 -.4332495 .0756797 
cons 71.13208 3 048286 23.34 0.000 65.15755 77.10661 


Random-effects Parameters 





[95$ Conf. 












Interval] 


cendiv: 





Independent 


sd(logdens) 2.703845 -7727275 1.544252 4.734186 
sd(minority) .1465435 .0428326 .0826365 .2598728 
sd(colled) .3683903 .0962733 .220729 .6148326 
sd(. cons) 8.416873 2.417524 4.793643 14.77869 








State: Independent 
sd(colled) 
sd(. cons) 


.1305727 .039009 .0727032 .2345047 
5.883451 - 7431715 4.593166 7.536196 






sd(Residual) 7.863302 .1027691 7.664436 8.067328 





LR t2st vs. linear regression: chi2(6) = 1695.92 Prob > chi2 = 0.0000 


0 0 H 31 
Note: LR test is conservative and provided only for reference. 
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عند إلقاء نظرة سريعة على كل التأثيرات العشوائية لكلا المتغيرين» فإن 
المتغيرين cendiv, state‏ في المخرجات أعلاه يبدو أنهما ذات Ay gine‏ وهذا 
يبدو واضحاً من خلال فترات الثقة والأخطاء المعيارية لهذين المتغيرين. 
الانحراف المعياري للمعاملات العشوائية عند مستوى الولايات للمتغير 
colled‏ )0.13( أقل من الانحراف المعياري للمعاملات العشوائية عند مستوى 
تقسيمات السكان (0.37) ولكن كلاهما متعلق بدرجة كبيرة بمعامل التأثير 
العشوائي للمتغير colled‏ )70.18( أما فترة الثقة لمعامل مستوى AN sll‏ 
فيتراوح ما بين 0.07 إلى .0.23 واختبار معدل الأرجحية العظمى يُشير إلى 
أن هذا النموذج (والذي يُسمى هنا (state‏ مع تقاطعات عشوائية لمستوى 
الولاية وقيم ميل أكثر تناسباً من النموذج السابق (full)‏ والذي كان له 
تقاطعات عشوائية لمستوى تقسيمات السكان وقيم الميل. 


.egtimates store state 
.lrtest full state 


Likelihood-ratio test LR chi2(2) = 929.97 
(Assumption: full nested in state) Prob > chi? = 0.0000 


Note: The reported degrees of freedom assumes the null hypothesis is not on the boundary of the 
parameter space. If this is not true, then the reported test is conservative. 


وكما تم سابقاء فإنه يمكننا أن نتوقع التأثيرات العشوائية ثم نستخدمها 
لحساب ورسم التأثيرات الكليةء بالنسبة للمتغير colled‏ لدينا الآن تأثيرات 
عشوائية من 49 ولاية مختلفةء الرسم البياني الصندوقي يمثل التوزيع 
بطريقة جيدة (الشكل 7.13) والذي يتبع نمطا Lle‏ لتأثيرات تقسيم السكان 
الذي رأيناه سابقا في الشكل )6.13( ولكنه الآن مع تباين لكل تقسيم. ففي 
الرسم البياني تظهر إنديانا (المنطقة الوسطى الشمالية الشرقية) وأوكلاهوما. 
(المنطقة الوسطى الجنوبية الغربية) كقيم متطرفةء GY‏ كلا منهما يظهر 
بصورة غير معتادة في تقسيمه الخاص. 


-predict re*, reffects 
describe rel-re6 
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storage display value 
variable name type format label variable label 
rel float %9.0g BLUP r.e. for cendiv: logdens 
re2 float, $9.0g BLUP r.e. for cendiv: minority 
rej float $9.0g BLUP r.e. for cendiv: colled 
re4 float %9.0g BLUP r.e. for cendiv: | cons 
re5 float %9.0g BLUP r.e. for state: colled 
re6 float %9.0g BLUP r.e. for state: _cons 


.gen tecolled2 = re3 + re5 + _b[colled] 
.label variable tecolled2 

"cendiv + state + fixed effect of % college 
grads" 
-graph hbox tecolled2, over(cendiv) yline(-.16) 
marker(1, mlabel(state)) 






New England 
Middle Atlantic 
E North Central 
W North Central 
South Atlantic 


E South Central 





W South Central Ú eokisnoma 
Mountain 


Pacific 


-5 0 
cendiv + state + fixed effect of % college grads 


الشكل )7.13( 


ولمعرفة أدو ات ما قبل التقدير الأخرى xtmixed‏ قم بطباعة الأمر help‏ 
cxtmixed postestimation‏ كما أن دليل المستخدم Longitudinal/Panel Data‏ 
Reference Manual‏ 5. كتاب Rabe-Hesketh and Skrondal‏ )2012( تعرض 
تطبيقات عن صياغة النماذج المختلطة مثل هياكل التغاير القطريّة المقفلة؛ 
ونماذج التأتيرات المقطعية. 
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Repeated Measurements : اطتكرره‎ anulabl 





الملف 60 يحتوي على بيانات لتجربة غريبة تم إجراؤها في 
احتفال لطلبة بالجامعة» وخلال هذا الحفل يقوم الطلبة بتناول بعسض 
المشروبات» في هذه التجربة تم سؤال 15 llla‏ جامعياً ليقوموا بتقييم فردي 
لجاذبية صور رجال ونساء لايعرفونهم على مقياس من 1 إلى 10» تم تكرار 
عملية التقييم لكل مشارك من خلال إعطائه نفس الصور بعد خلطها عشوائيا 
أربع مرات خلال فترة المساء. المتغير ratemale‏ يمثل متوسط التقييم الذي 
أعطاه كل مشارك لكل صور الذكور في جلسة واحدة. والمتغير ratefem‏ 
يمثل متوسط التقييم الذي تم إعطاؤه لصور SLY!‏ المتغير dau gender‏ 
جنس المشارك نفسه؛ والمتغير bac‏ يسجل نسبة الكحول في الدم والذي يقاس 
بجهاز قياس الكحول في الدم. 


.use C:\data\attract2.dta, clear 


.describe 
Contains data from C:\data\attract2.dta 
obs: 204 Perceived attractiveness and drinking -- DC 
Hamilton (2003) 
Vars: 7 2 Jul 2012 06:11 
size: 3,876 
Storage display value 
variable name type format label variable label 
id byte %9.0g Participant number 
gender byte %9.0g gender Gender 
bac float $9.0g Blood alchohol content 
single byte  $9.0g single Relationship status single 
drinkfrq float $9.0g Days drinking in previous week 
ratefem float $9.0g Rated attractiveness of females 
ratemale float 59.09 Rated attractiveness of males 


Sorted by: id bac 


فرضيات البحث تتضمن أن "أكواب A‏ لها تأثير على تقييم 
المشارك: هل الغرباء يُصبحون أكثر جاذبية إذا قام المشارك بشرب كميات 
أكبر من الكحول؟ وفي سياق هذه التجربةء هل هناك علاقة إيجابية بين نسبة 
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الكحول في الدم» ومعدلات الجاذبية المعطاة للصور؟ وإذا كان الأمر كذلك. 
فهل هذه العلاقة تختلف بين جنسي المشاركين أو بين الصور؟ 

بالرغم SE‏ البيانات تحتوي على 204 مشاهداتء فإنها تمشل 51 
مشاركا «lasà‏ ويبدو أنه من المعقول الاعتقاد بان المشاركين ربما يختلفون في 
ميولهم BY awe elbc y‏ أعلى أو أقل cle le‏ ويختلفون في ردة فعلهم تجاه 
الكحول. ٠‏ نموذج تأثيرات مختلطة مع تقاطعات عشوائية وقيم ميل يمكنه 
استيعاب هذه التعقيدات المحتملة. هذا الوضع يختلف عن مثال الانتخابات 
السابق في أن التقاطعات العشوائية الفردية وقيم الميل لن تكون مثيرة للاهتمام 
بدرجة كبيرة لأنها تفسر أفرادًا مجهولين. أما هذه التجربة فهي عبارة عن 
بيانات أو ملامح تصميم تجريبي نحتاج لتعديله عند اختبار الفرضيات الرئيسة. 

باستخدام رموز المتغير العاملي» فإن الأمر xtmixed‏ أدناه يُحدد نموذجاً 
به متوسطات التقييم المعطاة لصور وجوه الإناث (ratefem)‏ ويتم sul‏ بها 
بواسطة التاثير ات الثابتة للمتغير الإشاري «gender‏ والمتغير المستمر c‏ 
وتفاعلهماء بالإضافة إلى ذلك» فإن النموذج يتضمن تقاطعات عشوائيةء وقيم 
ميل للمتغير bac‏ والتي يمكن أن تختلف بين المشاركين. 


.xXtmixed ratefem i.genderiic.bac || id: bac, nolog 


Mixed-effects ML regression Number of obs z 204 
Group variable: id Number of groups = 51 
Obs per group: min - 
avg - 4.0 
max = 
Wald chi2(3) = 56.95 
Log likelihood = -170.9156 Prob > chi2 = 0.0000 

















ratefem Coef. Std. Err. 





(95% Conf. Interval) 








l.gender 









-.6280836 3203292 -1.96 0.050 -1.255917 -.0002499 


bac 3.433733 .5231428 6.56 0.000 2.408392 4.459074 
genderfttc.bac 
1 -1.154182 .9270306 -1.25 0.213 -2.971128 .6627648 

= 


-cons 6.442059 .1903235 33.85 0.000 6.069032 6.815086 
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Random-effects Parameters Estimate Std. Err. (95% Conf. Interval] 









id: Independent 





1.621421 .6564771 .7332693 3.585323 
1.056773 .1087889 .8636849 .293029 


sd(bac) 
sd(_cons) 













.387819 






.2931186 





sd(Residual) .3371602 


LR test vs. linear regression: ° chi2(2) = 279.98 Prob » chi2 - 0.0000 


Note: LR test is conservative and provided only for reference. 


هذه النتائج لصور GLY!‏ تدعم فرضية أكواب الجُعّة: فمعدلات الجاذبية 
لوجوه الإناث تزداد بزيادة نسبة الكحول في الدم» الجنس له تأثير لا يكاد أن 
يكون ملحوظا: فالنساء أعطين معدلات أقل بقليل لوجوه النساءء تفاعل 
المتغيرين genderxbac‏ ليس ذا gine‏ 4.1 4 إحصائية. Uses‏ فإن الميل العشوائي 
والتقاطع العشوائي للمتغير bac‏ شهد BE‏ ذا معنوية إحصائية وتضمن 
اختلافات جوهرية من شخص oy‏ في متوسط المعدلات المعطاة وكيفية 
تأثير الكحول على هذه المعدلات. 

الأمر margins‏ والأمر marginsplot‏ يساعدان في عرض هذه النتائج 
ER‏ فمخرجات هذين ETATEN]‏ هناء ولكن سوف يتم دمجها مع 
التحليل التالي لتشكل OSA‏ )8.13(. 


«margins, at(bac= (0(.2).4) gender-(0 1)) vsquish 
.marginsplot, title("Female photos") ytitle("") 
xtitle("") noci 

legend(position(11) ring(0) row(2) 
title("Gender", size(medsmall))) 

ylabel(4(1)8, grid gmin gmax) 
plotlopts(lpattern(solid) msymbol(T)) 

- plot2opts(lpattern(dash) msymbol(Oh)) saving 
(fig13 08RF) 


الأمر xtmixed‏ الثاني يقوم بصياغة نمؤذج لمعدلات صور الذكور 
:(ratemal)‏ 


.xtmixed ratemal i.gender##c.bac || id: bac, 
nolog 
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Baar dab c Sg ge ees‏ 


Mixed-effects ML regression Number of obs = 201 
Group variable: id Number of groups 2 51 
“bs per group: min = 3 

avg = 3.9 

max = 4 

Wald chi2(3) = 32.74 

Log likelihood = -221.83425 Prob > chi2 = 0.0000 










ratemale Coef. Std. Err. [95% Conf. Interval] 








2.011293 3742453 5.37 0.000 1.277786 2.744801 












l.gender 


bac .6401159 .7601351 0.84 0.400 -.8497215 2.129953 

gender #c.bac 
1 .6055665 1.328251 0.46 0.648 -1.997758 3.208891 
3.946884 .2224468 3.510897 4.382872 






















Random-effects Parameters Estimate (95$ Conf. Interval] 








id: Independent 
sd(bac) 


sd(. cons) 


2.738856 .535468 1.867035 4.017777 
1.223205 .1284553 .9956575 1.502756 


.4408696 





sd(Residual) 





.0278099 





.389598 .4988886 


LR test vs. linear regression: chi2(2) - 255.98 Prob » chi2 - 0.0000 


Note: LR test is conservative and provided only for reference. 


لا يبدو أن هناك تأثيرًا لأكواب الجعة على كيفية تقييم صور الذكور. 
ومن ناحية أخرىء فإن الجنس كان له تأثير ثابت LÍ «s gl‏ تفاعل المتغيرين 
gender, bac‏ لم يكن ذا معنوية إحصائيةء ولكننا مرة أخرى رأينا تباينا ذا 
معنوية في الميل والتقاطع العشوئي. 

margins, at(bac = (0(.2).4) gender = (0 1)) 
vsquish 

-marginsplot, title("Male photos") ytitle("") 
xtitle("") noci 

legend(position(11) ring(0) row(2) 
title("Gender", size(medsmall))) 

ylabel(4(1)8, grid gmin gmax) 
plotlopts(lpattern(solid) msymbol (Ty) 
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plot20pts(lpattern(dash) msymbol (Oh) ) 
saving (£ig13_08RM) 


الشكل )8.13( يدمج الشكلين البيانيين marginsplot‏ وذلك للمقارنة 


Saad 
.graph combine fig13_08RF.gph fig13_08RM.gph, 
imargin(vsmall) 11 ("Mean attractiveness 


rating")b2("Blood alcohol content") 


Female photos Male photos 


Gender 
له‎ Male 


—-9—- Female 


Mean attractiveness rating 





0. 2 4 0 2 4 
Blood alcohol content 


الشكل )8.13( 


الجانب الأيسر من الشكل )8.13( يعرض التأثير الجوهري للكحول 
على تقييم صور الإناث. المشاركون من الذكور قاموا بإعطاء معدلات أعلى 
les‏ ما وظهر بأنهم كانوا LAG asd‏ والكحول + casali‏ الأيمن over.‏ 
مختلفاء لتقييم صور الذكور. كما أن المشاركات GLY!‏ قمن بإعطاء معدلات 
أعلى بشكل ds gals‏ ولكن تقييم المشاركين من الذكور والإناث لم يتغير 
بصورة كبيرة كلما زاد تناول الكحول. 
السلاسل الزمنية امقطعية : Cross-Sectional Time Series‏ 


هذا الجزء يقوم بتطبيق الأمر xtmixed‏ على نوع مختلف من البيانات 
متعددة المستويات» وهو انسلاسل الزمنية المقطعية»ء ملف البيانات 
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Alaska regions.dta‏ يحتوي على سلاسل زمنية للسكان في 27 قرية أو بلدية 
أو مناطق تعداد والتي تمثل Lee‏ ولاية آلاسكاء هذه 27 منطقة هي جزء من 
إطار لقاعدة بيانات سمات الإنسان لعموم القطب الشمالي تم شرحها بواسطة 
Hamilton and Lammers‏ )2011(« في بيانات الملف Alaska regions.dta‏ هناك 
متغير وهمي اسمه large‏ يمثل أكثر خمس مناطق ازدحاماً بالسكان» والتي 
كان بها axe‏ السكان في سنة 2011 أكبر من 20,000« المناطق الأخرى 
ال:22 يغلت عليها الطابع الريفي,وبتكادها أقل. وربما متؤزعون على Us‏ 
واسع. فمثلاً القرية بشمال غرب القطب الشمالي تغطي منطقة جغرافية أكبر 
من ولاية Maine‏ بالولايات المتحدة؛ ولكن are‏ سكانها أقل من 8,000 نسمةء 
لكل منطقة من المناطق 27 هناك بيانات لعدد من السنوات تتراوح من سنة 
9 إلى 2011 ولكن مع وجود العديد من القيم المفقودة» ولذا فإنه لكل 
متغير هناك 27 نظيرًا ولكنه في العادة عبارة عن سلاسل زمنية ناقصة. 


.use C:\data\Alaska_regions.dta, clear 
.describe 


Contains data from C:\data\Alaska_regions.dta 


obs: 852 Alaska regions population 1969-2011 
vars: 7 2 Jul 2012 06:11 
size: 44,304 
Storage display value 
variable name type for:at label variable label 
regionname str34 %34s x Region name 
regioncode float %9.0g AON-SI region code 
year int $9.03 Year 
pop double $12.0g Population in thousands 
large byte $9.0g large Regions 2011 population » 20,000 
year0 byte %9.0g years since 1968 
year2 int %9.0g years0 squared 


Sorted by: regionname year 


خلال النصف الأول من الفترة الزمنية التي تغطيها البياناتء لوحظ أن 
عدد السكان ازداد بصورة كبيرة في العديد من المناطق الريفية في AST‏ 
وعموماً فإنه في_السنوات الأخيرة فإن معدل النمو انخفض» وفي gau‏ 
المناطق انخفض عدد السكان. هذه الاتجاهات لها علاقة بالجدل الدائر حول 
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النمو الاقتصادي المستدام لهذه المناطق» وأيضاً الأهمية الثقافية لسكان آلاسكا 
الأصليين الذين يعيشون هناك. 
ولأن اتجاهات عدد السكان ببساطة لم تزدء فلا يمكننا صياغة نموذج 
واقعي كدالة خطية للسنوات year‏ فالنموذج المختلط أدناه يمثل اتجاه عدد 
السكان كدالة تربيعية تقوم بحساب انحدار يعدد السكان بالآلاف (pop)‏ على 
السنوات (year0) 1968 41 ia‏ وأيضا على تربيع 0 » سوف نسمح 
للتقاطع الثابت (8) والعشوائي (u)‏ وقيم الميل لكلا الحدين» أكبر خمس مناطق 
مزدحمة بالسكان تم استبعادها في هذا التحليل حتى نركز على المناطق 
الريفية بآلاسكا. 
axe. population; = Bo + Byyear0, + Bryear0’ + uy + uye ar;‏ السكان 
uzyear0 ; + €; [7.13]‏ + 


.keep if large == 0 
.xtmixed pop year0 year2 ||  regionname: year0 
year2 


Performing EM optimization: 

Performing gradient-based optimization: 
Iteration 0: log likelihood = -457.61229 
Iteration 1: log likelihood - -457.61196 


Iteration 2: log likelihood = -457.61196 


Computing standard errors: 


Mixed-effects ML regression Number of obs = 639 
Group variable: regionname Number of groups = 22 
Obs per group: min = 22 

avg = 29.0 

max = 40 

Wald chi2(2) = 1.22 

Log likelihood - -457.61196 Prob » chi2 = 0.5424 








Coef. Std. Err. z P» |z| (95% Conf. Interval] 









.0615239 .0783008 -.0919428 .2149906 
-.0008945 .0010787 -0.83 0.407 -.0030087 .0012197 
5.457939 1.342116 2.82744 8.088438 














year2 
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Estimate Std. Err. [95$ Conf. Interval] 





Random-effects Parameters 















regionname: Independent 


sd(year0) -3563579 0619934 . 2534009 .5011464 
sd(year2) . 004861 . 0008663 .0034278 .0068933 
sd(. cons) 6.145796 1.04392 4.405485 8.573587 










-3524305 .3317988 .3743451 






sd (Residual) .0108473 





LR test vs. linear regression: chi2(3) = 2703.76 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 


كل التأثيرات العشوائية توضح WLS‏ ذا معنوية إحصائية من مكان 
لآخر. ومن ناحية أخرىء فإن مُعاملات التأثير الثابت للمتغير year‏ والمتغير 
2 لا تختلف بدرجة كبيرة عن الصفرء مشيرة إلى النقص في وجود نمط 
عام ل 22 منطقة» الرسم البياني يتنبأ بعدد السكان (مع منحنى وسيط 
محدب) مع عدد السكان الفعلي والسنةء وهذا يساعد في عرض تفاصيل 
التباين من منطقة es AY‏ ويشرح عدم قدرة الأمر xtmixed‏ على إيجاد اتجاه 
عام (الشكل 9.13(« وفي بعض المناطق فإن aae.‏ السكان زاد بثبات» بينما 
في مناطق أخرى فإن اتجاه النمو انخفض .أو انعكس. النموذج يقوم بعمل جيد 
لتقليل بعض الفجوات الواضحة في البيانات مثل استبعاد عدد السكان في 
جز راليوتائيس الغربية Aleutians West‏ التي شهدت انخفاضا بعد تقليص 
المحطة الجوية البحرية في سنة 1994 أو الزيادة في المنحدر الشمالي North‏ 
Slope‏ التي حدتت بعد زيادة العاملين في المناطق البعيدة وكانت هذه الزيادة 

واضحة في تعداد سنة 2010. 
.predict yhat, fitted‏ 


-graph twoway scatter pop year, msymbol (Oh) 
| | mspline yhat year, lwidth(medthick) 
bands (50) 

, by(regionname, note("") legend(off)) 
ylabel(0(5)20, angle (horizontal) ) xtitle("") 
ytitle("Population in 1,000s") 
x1abel(1970(10)2010, grid) 
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الشكل )9.13( 


سوف نقوم بتحليل” أكثر موضوعية» وذلك باستخدام انحدار التأثيرات 
المختلطة لصياغة نموذج للعلاقات يتضمن سلاسل زمنية متعددة يظهر في 
ورقة بحثية حول تعداد السكان والمناخ والكهرباء المستخدمة في مدن وقرى 
المنطقة القطبية الشمالية في آلاسکا Hamilton et al.)‏ 2011( بيانات الملف 
Alaska. places.dta‏ تحتوي على البيانات الأساسية لهذا التحليلء وتتضمن 
سلاسل زمنية سنوية لكل من 2 قرية ومدينة في المنطقة القطبية الشمالية 
في آلاسكا وكلها ضمن مناطق التعداد الخمس أو القرى التي تم تمثيلها بيانيا 
في الشكل (9.13) أعلاه. المتغيرات تتضمن السكان وكيلووات ساعة 
للكهرباء المباعة والمعدل المتوسط لتكلفة الكهرباء (التي كانت سائدة في Aia‏ 
9 بالدولار) وتقديرات درجات حرارة الصيف» ومعدل الهطول حول 
تلك المنطقة في كل سنةء الورقة تزودنا بمعلومات حول تعريفات المتغيرات؛ 
ومصادر البيانات» وشرح لهذا التحليل. 
.use C:\data\Alaska_places.dta, clear‏ 
.describe‏ 
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Contains data from C:\data\Alaska_places.dta 


obs: 742 Population, climate & electricity use in the Arctic 
(Hamilton 2011) 
vars: 12 2 Jul 2012 06:11 
size: 57,876 
storage display value 
variable name type format label variable label 
regionname str24 $24s Region name 
regioncode long  $9.0g AON-SI region code 
place str21 421s Place name 
placecode byte %21.0g placecode 
Place code (labeled) 

year int &ty Year 
pop int $12.0g Population--est. Jul l/Census Apr 1 
logpop float %9.0g logl0(pop! 
kwhsold20 float $9.0g kWh sold ajusted if 9-11 months, millions 
logkwhsold float %9.0g 1og10 (kwhsold20) 
rateres09 float %9.0g av. res. rate 2009$ = rateres*cpianc09 
fsumtempD float %9.0g UDel FY summer (L1.Jul-Sep & May-Jun) temp 
fsumprecD float %9.0g UDel FY summer (Ll.Jul-Sep & May-Jun) prec 





Sorted by: placecode year : 


هذه البيانات تم اعتبارها بيانات طولية عن طريق الأمر extset‏ والذي 
ali‏ بتحديد المتغير placecode‏ کمتغیر طو لي» والسنة year‏ كمتغير زمني: 
-xtset placecode year‏ 
panel variable: placecode (unbalanced)‏ 


time variable: year, 1990 to 2008, but with gaps 
delta: 1 year 


تحليل التأثير المختلط أدناه يقوم بصياغة نموذج للكيلووات ساعة 
للكهرباء المباعة في كل حي وكل سنة كدالة لعدد السكان» ومعدل الكهرباء 
بالدولار li,‏ لسنة 2009 وحرارة الصيف والهطول والسنة. النموذج 
يتضمن تأثيرات عشوائية لكل من التعداد السكاني؛ وأخطاء الانحدار الذاتي 
من الدرجة الأولى. السبب وراء صياغة النموذج بهذا الشكل واختبارات الثقة 
لنتائج النموذج تم عرضها في الورقة. الاختصار في العرض هنا يهدف إلى 
توضيح ما سوف يكون عليه مثل هذا النوع من التحليل. 


-xtmixed logkwhsold logpop rateres09 £sumtempD 
fsumprecD year í 
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| | Placecode: logpop, nocons residual(ar 1, 
t(year))nolog reml 


Note: time gaps exist in the estimation data 


Mixed-effects REML regression Number of obs = 742 
Group variable: placecode Number of groups = 42 
Obs per group: min = 12 

avg = 17.7 

max = 19 

Wald chi2(5) = 359.12 

Log restricted-likelihood = 1008.232 Prob » chi2 = 0.0000 










logkwhsold Coef. Std. Err. z P»|z| [95$ Conf. Interval] 


.7086409 .0716509 9.89 


logpop 0.000 .5682078 .849074 
rateres09 -.0011494 .0005259 -2.19 0.029 -.0021801 -.0001187 
fsumtempD -.0038939 .0018784 -2.07 0.038 -.0075755 -.0002123 
fsumprecD .000272 .0001416 1.92 0.055 -5.57e-06 .0005495 

year .012952 .0010914 11.87 0.000 .0108129 .0150911 

—cons -27.51866 2.153197 -12.78 0.000 -31.73885 -23.29847 












Random-effects Parameters Estimate Std. Err. [95$ Conf. 





Interval] 






placecode: Identity 


sd(logpop) 0989276 .0132542 .0760807 .1286354 












Residual: AR(1) 





rho . 7900083 .0394952 .699089 .8557882 


.0857878 .0076267 .0720696 .1021173 






LR test vs. linear regression: chi2(2) = 1506.36 Prob > chi2 = 0.0000 


Note: LR test is conservative and provided only for reference. 


النموذج هو: 
log(kwhres;,) = -27.52 + 0.7086 llogio(pop,,) - 0.0011rateres09;, — 0.0039fsumtep;,‏ 

0.0003fsumprec, + 0,1301 + pulogo(pop;) + 0.79000, + uu — [13.8]‏ + 
استخدام الكهرباء في قُرى المنطقة القطبية الشمالية تم التنبؤ به بواسطة 
aae‏ السكان»ء والسعر» ودرجة حرارة الصيف. ule y‏ عكس الوضع في 
Chall aad a UC BOT‏ كارا و الذي" ياتاش Pst‏ 
el eS‏ سيب النكيفاكه Ail‏ ]13 كان ضيف المتاطق ull‏ الكثمالية Las‏ 
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(وفي العادة أقل مطرا) فقد يؤدي ذلك إلى تشجيع الناس إلى قضاء أوقات أكبر 
خارج بيوتهم» وبتعديل انموذج للأخذ في الاعتبار تأثيرات عدد السكان 
والسعر والجوء فإننا نرى نمطا تصاعديا Ule‏ في استخدام e La Sli‏ لان 
الحياة تصبح أكثر تطلبا للكهرباء. وأخيراً فإن التباين الكبير في الميل العشوائي 
لعدد السكان يشير إلى أن تأثيرات كل شخص تختلف من مكان coil‏ وهاه 
التأثيرات تميل لتكون أكبر في المناطق الشمالية ومجتمعات مناطق المنحدر 
الشمالية» as‏ الخطأ للانحدار الذاتي (۸۸)1 يظهر Lal‏ ذو معنوية إحصائية. 


وكما لاحظنا في الفصل (12) فإن السلاسل الزمنية عادة يتم اختبار 

ستقرارها stationarity‏ صياغة النموذج» وذلك لتجنب الحصول على 
7 مضللةء الفروقات تعتبر إحدى الأدوات المفيدة للقيام ellis‏ ويلا Doa‏ 
cell‏ فإنه حتى عندما تكون السلاسل الزمنية غير مستقرة - كما في هذا 
المثال (أو كما في نماذج ARMAX‏ في الفصل 12) - فإنه يمكننا البحث عن 
مزيج خطي من المتغيرات المستقرة (لمزيد من المعلومات عن التكامل 
المشترك cointegration‏ انظر Hamilton GUS‏ 1994( النموذج ]8.13[ يمكنه 
القيام بهذه المهمة بكفاءة عالية» كل 42 سلسلة المتبقية (سلسلة baal‏ لكل 
مجتمع) والتي تم إنشاؤها بواسطة هذا التموذج لم يُظهر أي منها ارتباطا 
ذاتياً ذا معنوية إحصائية في اختبار إحصائيات © الصندوقية. ولذلك فإن 
البواقي لا يمكن تمييزها عن ad‏ الضجيج الأبيض» وقيم عملية التغاير 
الثابت. الأوامر أدناه تقوم بحساب القيم المتوقعة آخذة في الاعتبار ics‏ 
الانحدار الذاتي (Rar xi)‏ ثم يتم استخدام هذه التوقعات لحساب البواقي 
(residan‏ اختبارات © للضجيج الأبيض (wntestq)‏ لا تعرض انحدارا ذاتيا 

متبقيا. والمخرجات أدناه هي discs do^ eC‏ 


.predict yhat xt, fitted 

.generate resid xt - logkwhsold - yhat xt 

.replace yhat_xt= yhat xt +(.7900077*L1.resid_xt) 
-gen yhat xti10 = 10^yhat xt 

.replace resid xt - logkwhsold - yhat xt 

. label variable yhat xt "predicted values 
log(million kWh)" 


.label variable yhat xt10 "predicted values in 
millions of kWh" 
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.label variable resid xt "residuals log(million 
kWh) " 

.wntestq resid xt if place == "Ambler city", 
lags(5) 


Portmanteau test for white noise 


Portmanteau (Q) statistic - 4.3048 
Prob » chi2(5) 0 E 0.5064 
.wntestq resid xt if place == "Anaktuvuk Pass 


city", lags(5) 


Portmanteau test for white noise 


Portmanteau (Q) statistic - 2.3503 

Prob » chi2(5) = 0.7989 
ewntestq resid xt if place == "Aniak city", 
lags (5) 


Portmanteau test for white noise 
Portmanteau (Q) statistic = 5.6826 
Prob » chi2(5) = 0.3383 
اختبارات مشابهة لكل 42 مجتمعا وجدت بأن جميع سلاسل البواقي ليس‎ 
لها ارتباط ذاتي ذو معنوية.‎ 
: الاحدار اللوغاريثمي ذو الثائيرات اطخئلطة‎ 
Mixed-Effects Logit Regression 
(2005 Davis et al.) سنة 1972 يحاول الاستطلاع الاجتماعي العام‎ Ma 
بمتابعة الرأي العام الأمريكي من خلال سلاسل استطلاع سنوية أو نصف‎ 
سنوية. وهذه البيانات متوافرة للتدريس والبحثء. ملف البيانات‎ 
يحتوي على عينة فرعية صغيرة لمتغيرات ومشاهدات من‎ GSS 2010 SwS 
استطلاع سنة 2010+ وهي تتضمن متغيرات إضافية مع إجابات عن أسئلة‎ 
موقع الاستطلاع الاجتماعي العام655 على الإنترنت يوفر معلومات مفصلة‎ 
-(http://www3.norc.org/GSS-* Website) عن مصدر هذه البيانات:‎ 


640 الإحصاء مع برنامج ستاتا 





.uge C:\data\GSS_2010_SwS.dta, clear 
.describe 
Contains data from C:\data\GSS_2010_SwS.dta 





obs: 809 General Social Survey 2010--evolution etc. 
vars: 19 2 Jul 2012 06:11 

size: 21,843 

storage display value 

variable name type format label variable label 
id int $8.0g Respondent ID number 
year int &$8.0g GSS year 
wtssall float %9.0g LABCM probability weight 
cendiv byte %15.0g cendiv Census division 
logsize float $9.0g 10910 (size place in 1,000s, +1) 
age byte $8.0g age Age in years 
nonwhite byte %9.0g nonwhite Consider self white/nonwhite 
sex byte %8.0g sex Respondent gender 
educ byte %8.0g educ Highest year of schooling 
married byte %9.0g yesno Currently married 
income06 byte %15.0g income Total family income 
polviews byte %12.0g polviews Polit views liberal-conservative 
bush byte %9.0g yesno Voted for Bush in 2004 
obama byte %9.0g yesno Voted for Obama in 2004 
postlife byte %8.0g yesno Believe in life after death 
grass byte %9.0g grass Should marijuana be legalized? 
gunlaw byte — $9.0g gunlaw Oppose permit required to buy gun 
Sealevel byte %10.0g sealevel Bothered if sea level rose 20 ft 
evolve byte %9.0g true Humans developed/ earlier species 





Sorted by: id 


سؤال 655 حول التطور سوف يكون المحور الأساسي لهذا التحليل. هذا 
السؤال يحتوي على جزء من القدرة على القراءة والكتابة والعلوم ويسأل عما 
إذا كانت العبارة أدناه صحيحة أو خاطئة. 
البشر - كما نعرفهم اليوم - تطوّروا من سُلالات سابقة من الحيوانات. 
هذا السؤال يستند إلى اعتقادات فرديةء بالإضافة إلى معرفة علمية؛ 
حوالي 9655 من المشاركين قالوا إن هذه العبارة صحيحة. 
.tab evolve‏ 


Humans 
developed/ 
earlier 
species Freq. Percent Cum. 
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لا توجد قيم مفقودة للمتغير evolve‏ ولا يوجد معيار تم وضعه لاختيار 
هذا الجزء الفرعي من البيانات والذي يمثل 809 مشاركين في استطلاع 
GSS‏ الإجابات التي تقول بأن العبارة "خاطئة" "False"‏ في المتغير evolve‏ تم 
ترميزها بالرقم 0 والعبارة '"صحيحة" “True”‏ 1ء السؤال حول الاستطلاع 
المرجح يُعتبر مسألة معقدة مع النماذج متعددة المستويات. وهذه المسألة لم 
يتم حلها بعد في xtmelogit GU yd‏ ولن يتم تناولها هنا. 

وفي العادةء فإن البحوث aad‏ أن زيادة القدرة على القراءة والكتابة 
والعلوم تزداد مع التعليم» وأيضا تتعلق بعوامل أخرى تتعلق بخلفية الشخص› 
وفي Alla.‏ المتغير evolve‏ فإننا نتوقع أن هذا المتغير له علاقة ما مع التوقعات 
السياسية أيضاء فالانحدار اللوغاريتمي البسيط يؤكد مثل هذه الفرضيات» 
حيث إن النتائج تشير إلى أن الذكور ذوي المستوى التعليمي وذوي وجهات 
سياسية معتدلة في الغالب يعتقدون بتطور الإنسان من سلالات حيوانية 


EM 

.logit evolve sex age educ polviews, nolog 
Logistic regression Number of obs = 785 
LR chi2(4) = 98.93 
Prob > chi2 = 0.0000 
Log likelihood = -489.36806 Pseudo R2 = 0.0918 
















evolve Coef. Std. Err. [95$ Conf. Interval] 










sex -.6089296 .1565972 -3.89 0.000 -.9158545 -.3020047 
age -.008189 .0045313 -1.81 0.071 -.0170701 .0006922 
educ .0990929 .0254359 3.90 0.000 .0492395 .1489463 
polviews | -.4482161 .0575731 -7.79 0.000 -.5610573 -.3353749 


1.457699 -4891102 0.003 -4990611 2.416338 





cons 






وبغض النظر عن he‏ هذه المتغيرات التنبؤية على المستوى الفردي 
بخصوص الاعتقاد حول التطور البشريء فإنه قد تكون هناك مكونات على 
مستوى المناطق أيضاء الخلافات حول تدريس التطور البشري في المدارس 
كان السمة البارزة في الجنوب. واتساقاً مع هذا الانطباع؛ فإن اختبار كاي 
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تربيع لبيانات GSS‏ يوضح فروقات GIS‏ معنوية إحصائية بين تقسيمات تعداد 
السكان بالولايات المتحدة» قبول الفرضية مرتفع las.‏ )%89( بين المشاركين 
في الدراسة من تيو New England 3—Dis3‏ وه,م, الولايات Maine,‏ 
«Massachusetts, New Hampshire, Rhode Island, Vermont‏ 5 هذه النسبة تكون 
عند أقل قيمة لها )%36( بين تقسيم السكان للمناطق الوسطى الجنوبية 
الشرقية E South Central‏ وهي Alabama, Kentucky, Mississipi, GLY sll‏ 
Tennessee‏ تقسيمات السكان في مناطق المحيط الهادئ Pacific‏ والمناطق 
الوسطى الجنوبية الغربية W South Central‏ و هي ثاني أعلى وثاني Ji‏ قيم 
على التوالي. 

.tab cendiv evolve, row nof 22 
Humans developed/ 


earlier species 
False True 




















Census division 





New England 


Middle Atlantic 
E North Central 100.00 
W North Central 100.00 
South Atlantic 100.00 
E South Central 100.00 
W South Central 100.00 
Mountain 100.00 


Pacific 







55. 





50 


Pearson chi2(8) - 48.6890 Pr - 0.000 


يمكننا إضافة تقسيم تعداد سكان لتحليل الانحدار كمجمورعة متغيرات 
إشارية للتقسيمات من 2 وحتى 9 كل منها يتناقضص مع تقسيم السكان 1 
الخاص بنيوانجلاند -New England‏ 


.logit evolve sex age educ Polviews i.cendiv, 
nolog 


- ae 
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Logistic regression Number of obs = 785 
LR chi2(12) = 124.92 

Prob > chi2 = 0.0000 

Log likelihood = -476.37206 Pseudo R2 = 0.1159 
evolve Coef. Std. Err. P>|z| [95% Conf. Interval] 



















sex -.5609946 .160387 -3.50 0.000 -.8753473 -.2466419 
age -.0092908 .0046327 , -2.01 0.045 -.0183706 -.0002109 
educ .0842967 .0261043 3.23 0.001 .0331333 .1354601 
polviews -.416007 .0591817 -7.03 0.000 -.532001 -.3000131 
cendiv 

2 -1.501592 .6612973 -2.27 0.023 -2.797711 -.2054736 

3 -1.602085 .6504787 -2.46 0.014 -2.877 -.3271704 

4 -1.505793 .6931599 -2.17 0.030 -2.864361 -.1472243 

5 -1.843963 -6442829 -2.86 0.004 -3.106734 -.5811918 

6 -2.149803 .6973044 -3.08 0.002 -3.516495 -.7831115 

7 -2.239585 .6743959 -3.32 0.001 -3.561376 -.9177932 

8 -1.454279 .6854426 -2.12 0.034 -2.797722 -.1108363 

9 -1.141026 .6642829 -1.72 0.086:  -2.442996 .1609447 


.179554 .8138406 3.91 0.000 1.584455 4.774652 


المُعاملات الخاص بالمتغيرات الإشارية لتقسيم ما تعطي تغييرًا في 
التقاطع -ر لذلك التقسيم بالمقارنة مع نيوإنجلاند» كل هذه المُعاملات سالبةء 
لأن الاحتمالات اللوغاريتمية لقبول الاعتقاد بالتطور البشري أقل في 
تقسيمات السكان الأخرى Aie‏ في نيوإنجلاند. وكما هو cad sie‏ فإن الفرق 
كبير las‏ للتقسيم 6 الذي يمثل المنطقة الوسطى الجنوبية الشرقية E South‏ 
LÍ «Central‏ التقسيم 9 الذي يمثل منطقة المحيط الهادئ Pacific‏ هو الوحيد 
الذي لا يختلف كثيرا واختلافه ليس ذا معنوية عن نيوإنجلاند» صافي هذه 
التأثيرات على مستوى المناطق وكل المتغيرات التنبوؤية على المستوى 
الفردي أظهرت تأثيرات ذات معنوية في الاتجاهات المتوقعة. 

طريقة المتغير الإشاري تعمل بشكل جيد هناء وذلك GY‏ لدينا 9 
مجموعات فقط (تقسيمات سكان)» وهذه التقسيمات تختبر فرضيات بسيطة 
حول E EET AS ja.‏ حو وعتد cule sana deny‏ أكثر أو فرضيات معقدة 
فإن طريقة التأثيرات المختلطة يمكن أن تكون أكثر عمليةء فمثلاً قد نقوم 
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Ed dd p MEE E MD NEM. LL eL 


بإدخال تقاطعات عشوائية لكل ena‏ في التعداد السكاني في نموذ- ج انحدار 
لوغاريتمي ذي تأثيرات مختلطة كما سيتم cla y‏ تركيبة الأمر xtmelogit‏ 
تتشابه مع تلك الخاصة بالأمر .xtmixed‏ 


.xtmelogit evolve sex age educ polviews || 
cendiv: , nolog 


Mixed-effects logistic regression Number of obs = 785 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 27 

avg = 87.2 

max = 181 

Integration points = 7 Wald chi2 (4) = 72.41 
Log likelihood - -487.10546. Prob » chi2 = 0.0000 














evolve [95$ Conf. Interval] 

















sex -.5794058 .1591076 0.000 -.8912511 -.2675606 

age -.0086106 .0045962 -1.87 0.061 -.0176191 .0003979 

educ .0910441 .0259804 3.50 0.000 .0401235 .1419647 
polviews -.4300722 .0588037 -7.31 0.000 -.5453254 -.3148191 
-cons 1.541323 .5135582 3.00 0.003 5347679 2.547879 












Random-effects Parameters 








Estimate Std. Err. [95$ Conf. Interval] 





cendiv: 





Identity 





sd(_cons) -3375876 -1559346 .1365241 





.8347641 





LR test vs. logistic regression: chibar2(01) - 4.53 Prob>=chibar2 = 0.0167 


التقاطعات العشوائية في المخرجات أعلاه توضح تبايناً ذا معنوية» وهذا 
ما يوضحه اختبار معدل الأرجحية العظمى مع الانحدار اللوغاريتمي العادي 
(p = 0.0167)‏ أو من خلال الانحراف المعياري للتقاطعات العشوائية 
)0.3376(« حيث إنه أكبر من ضعف خطأه المعياري )0.1559(« الأوامر 
التالية تقوم بتقدير aS‏ لهذه التقاطعات العشوائية من خلال الأمر predict‏ ثم 
إنشاء جدول يعرض هذه القيم بواسطة المتغير ccendiv.‏ وبالاتساق مع 
تحليلات كاي تربيع السابقةء وتحليلات المتغيرات الإشارية السابقة» فإننا 
نرى تقاطعات y-‏ عشوائية موجبة (مؤديا إلى زيادة التأثير الكلي) لتقسيمات 
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السكان في نيوإنجلاند والمحيط الهادئ» ولكن هناك تقاطعات y-‏ عشوائية 
سالبة (مؤديا إلى انخفاض التأثير الكلي) لتقسيمات السكان بالمنطقة الوسطى 
الجنوبية الشرقية والمنطقة الوسطى الجنوبية الغربية. 

.predict srecendiv, reffects 
.label variable recendiv "random-effect 


intercept cendiv" 
.table cendiv, contents(mean recendiv) 






mean (recendiv) 





Census division 







.4649539 
.0523787 










New England 
Middle Atlantic 





E North Central -.0165851 
W North Central .0429461 
South Atlantic -.2134227 
E South Central -.3085577 
W South Central -.4224425 
Mountain .083739 





:3052153 





Pacific 


ولذا فعند استخدام أي طريقة سوف نجد LG sa Lha‏ للاختلافات 
الإقليمية حول الاعتقاد بتطور الإنسان» حتى بعد التحكم في العوامل الفردية. 
فنماذج التأثيرات المختلطة تسمح لنا بالتقدم أكثر من خلال اختبار أفكار أكثر 
تفصيلا حول الاختلافات الإقليمية. 


بعض الدراسات حددت التعليم كمؤثر أساسي في الاعتقاد بتطور 
الإنسان» وبعض الاعتقادات العلمية الأخرىء والسؤال الآن هو: هل تأثيرات 
التعليم تختلف من تقسيم سكاني لآخر؟ يمكننا اختبار ذلك بواسطة إضافة قيم 
daa ose cab, da‏ 


.xtmelogit evolve sex age educ polviews | | 
cendiv: educ, nológ 
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Mixed-effects logistic regression Number of obs = 785 
Group variable: cendiv Number of groups = 9 
Obs per group: min = 27 

avg = 87.2 

max - 181 

Integration points - 7 Wald chi2(4) z 71.63 
Log likelihood = -486.57368 Prob > chi2 = 0.0000 











(95% Conf. Interval] 


evolve 










sex -.5692675 .1595327 -.8819458 -.2565893 

age -.0090823 .0046088 -1.97 0.049 -.0181153 -.0000492 

educ .0924205 .027522 3.36 0.001 .0384784 .1463627 
polviews -.4290164 .0588184 -7.29 0.000 -.5442984 -.3137343 
_cons 1.532699 .4979934 3.08 0.002 .55665 2.508748 

























Random-effects Parameters Estimate Std. Err. [95% Conf. Interval] 






cendiv: Independent 
sd (educ) 
sd(. cons) 


.0268375 .0115911 .0115109 .0625712 
5.23e-07 - 4785104 0 





LR test vs. logistic regression: chi2(2) = 5.59 Prob > chi2 = 0.0612 


Note: LR test is conservative and provided only for reference. 


الانحراف المعياري لقيم الميل العشوائي للتعليم أكثر من ضعف Lal‏ 
المعياري» وهذا يشير إلى أن التباين الإقليمي ذو معنوية إحصائيةء ومن 
ناحية أخرىء فإن الانحراف المعياري للتقاطعات العشوائية يقتقرب من 
الصفرء وهذا يعني عدم وجود تباين من مكان AY‏ قد يتم استخدام نموذج 
أبسط يقوم بإهمال التقاطعات العشوائية من خلال الخيار nocons‏ الذي يعطي 
أرجحية لوغاريتمية متطابقة. 


-xtmelogit evolve sex age educ polviews 
|| cendiv: educ, nolog nocons 
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Mixed-effects logistic regression Number of obs z 785 
Group variable: cendiv Number of groups = 9 
Obs per group: min - 27 

avg = 87.2 

max = 181 

Integration points = 7 Wald chi2(4) = 71.63 
Log likelihood = -486.57368 Prob > chi2 i 0.0000 












(95% Conf. Interval) 









evolve 





-.8819459 





-.2565893 





-.5692676 
-.0090823 . 0046088 -1.97 0.049 -.0181153 -.0000492 


.1595327 





sex 


age 

educ .0924205 .027522 3.36 0.001 .0384784 .1463626 
polviews -.4290164 .0588184 -7.29 0.000 -.5442984 -.3137343 
_cons 1.532699 . 4979933 .55665 2.508748 




















Std. Err. [95$ Conf. Interval] 





Estimate 





Random-effects Parameters 






cendiv: Identity 


sd(educ) .0268374 .011591 .0115108 .062571 


LR test vs. logistic regression: chibar2(01) - 5.59 Prob»-chibar2 - 0.0090 


نموذج الميل العشوائي المبسط أعلاهء يقوم على افتراض أن التعليم له 
تأثيرات مختلفة على الاعتقاد بتطور الإنسان في el jal‏ مختلفة من AA gall‏ 
ولمعرفة ماهي هذه التأثيرات» يمكننا توقع predict‏ قيم الميل (coil pall‏ 
وإنشاء متغير جديد ياسم sraneduc‏ التأثيرات الكلية للمتغير educ‏ تساوي هذه 
التأثيرات العشوائية زائد التأثير الثابت لمعامل b[educ]‏ « ثابت "المتغير" 
المُسمى fixeduc‏ يتم إنشاؤه لعرض التأثيرات الثابتة في جدول ومتغير جديد 
يُسمى toteduc‏ يعر ص التأثير ات الكلية للتعليم أو الميل على educ‏ لكل تقسيم 
سكاني. 1 
.predict raneduc, reffects‏ 
.label variable raneduc "random-effect slope‏ 
educ"‏ 
-gen toteduc = raneduc + _b[educ]‏ 
.label variable toteduc "total random + fixed-‏ 


effect slope educ" 
.gen fixeduc = _b[educ] 
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.label variable fixeduc  "fixed-effect slope 
educ (constant)" 

-table cendiv, contents(mean fixeduc mean 
raneduc mean toteduc) 








Census division mean(*ixeduc) mean(raneduc) mean(toteduc) 












New England .0924205 .0389457 .1313663 


Middle Atlantic .0924205 .0089432 .1013638 
E North Central .0924205 -.0036121 .0888085 
W North Central .0924205 .0035191 .0959396 
Souch Atlantic .0924205 -.0148976 .077523 
E South Central .0924205 -.0239878 .0684328 
W South Central .0924205 -.0366144 .0558061 
Mountain .0924205 .0033255 .095746 
Pacific .0924205 .0227141 .1151346 








من الجدول يمكننا التأكيد بأن التأثير الكلي للتعليم يساوي التأثيرات 
الثابتة زائداً التأثيرات العشوائية» الشكل )10.13( يعرض هذه الت أثيرات 

الكلية. 
graph hbar (mean) toteduc, over(cendiv)‏ 


ytitle("Effect of education on log odds 
believe evolution") 


New England 
Middle Atlantic 
E North Central 
W North Central 
South Atlantic 

E South Central 
W South Central 
Mountain 


Pacific 


.05 1 
Effect of education on log odds believe evolution _ 


الشكل )10.13( 
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نرى أن التعليم له تأثير موجب على الاحتمالات اللوغاريتمية لقبول 
فرضية تطور الإنسان في كل تقسيمات السكان» تأثيرات التعليم أكبر قوة بين 
المشاركين من ولايات نيوإنجلاند والمحيط الهادئ» مقارنة مع المناطق 
الوسطى ciall‏ بية الغربية والشرقية. 


ا 


- -m 


aM 
مقدمة في البرمجة‎ 
Introduction to Programming 





كما رأينا سابقاء فإنه يمكننا إنشاء نوع بسيط من البرامج بواسطة كتابة 
أي سلسلة من أوامر ستاتا في ملف نصّي (ASCH)‏ أو بمحرر الملف 
التنفيذي Do-file Editor‏ ببرنامج ستاتا (يمكنك الوصول إليه بالنقر على القائمة 
Window > Do-file Editor‏ أو jul‏ على أيقونة & ) يعتبر طريقة سهلة 
للقيام بذلك. بعد حفظ ملف do-file‏ سوف نقوم Du" eli «Stata Quas‏ في 
شكل do filename‏ فهذا يُخبر ستاتا بقراءة الملف المسمى filename.do‏ وتنفيذ 
كل الأوامر التي يحتويها هذا الملف. كما يمكن إجراء عمليات برمجة أكثر 
M a à‏ جه تدمج يدر دامع avis‏ أغلب أوامر ستاتا 
التي تم استخدامها $ في الفصول EA cjuo vid‏ تم VAS‏ في جرع 
ستاتا. هذه البرامج قد تم إنشاؤها أصلا بواسطة شركة ستاتا أو من 
مستخدمين يحتاجون أشياء لا يمكن للغة برمجة ستاتا القيام بها أو أنهم 
يحتاجونها لمهام معينة. 

برامج ستاتا يمكنها الوصول إلى كل مميزات ستاتاء حيث إن هذه 
البرامج تتصل ببرامج أخرىء وهذه الأخيرة تتصل ببرامج أخرىء 55 تستخدم 
أدوات مساعدة لصياغة النماذج. وهذه الأدوات تتضمن جبر المصفوفات» 
وتقدير الأرجحية العظمى» القدرة على كتابة برامج ستاتا توسّع ما يمكننا 
القيام به حتى ولوكان هدفنا cha las nd;‏ إضافة أساليب إحصائية جديدة أو 
هدف بسيط مثل إدارة قاعدة بيانات معينة. 
لبعض المفاهيم والأدوات الرئيسة مع بعض الأمثلة عن كيفية استخدامها لتسهيل 
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مهام تحليل البيانات. إذا كنت مهتما بتعلم تفاصيل أكثرء فيمكنك الاطلاع على 
الدروس الموجودة بموقع ستاتا (www.stata.com/netcourse)‏ فهي المكان المناسب 
gall Ul dala‏ الرئيس حول البرمجة فهو osa Ml pata all Qua‏ 
¿ye jag Programming Reference Manual‏ من Mata Matrix Programming lS‏ 
Manual‏ هناك تفاصيل عن تقدير الأرجحية العظمى والبرمجة في كتاب 
(Gould, Pitblado and Poi 2010) Maximum Likelihood Estimation with Stata‏ 


Basic Concepts and Tools : أدوات ومفاهيم أساسية‎ 


بعض الأدوات والمفاهيم الأساسية تدمج مع قدرات برنامج ستاتا - تم 
شرحها في فصول سابقة - تعتبر كافية كبداية. 
Do-files‏ 
الملفات التنفيذية do-files‏ هي ملفات نصية من نوع (ASCII)‏ تم إنشاؤها 
بواسطة محرر الملفات التنفيذية ببرنامج ستاتا Do-file Editor‏ أو محرر 
نصوص أو أي برنامج تحرير نصي آخر. وهذه الملفات يتم حفظها بامتداد 
do‏ الملف يمكن أن يحتوي على أي سلسلة من أوامر ستاتا المنطقية. وفي 
ستاتا طباعة الأمر أدناه تقود برنامج ستاتا إلى قراءة الملف filename.do‏ 
وتنفيذ الأوامر التي يحتويها هذا الملف: 
.do filename‏ 
كل أمر في الملف filename.do‏ بما فيه آخر أمرء يجب أن ينتهي بنهاية 
السطر ليبدأ من بداية سطر جديد مالم نضع محدذا من خلال الأمر delimit‏ 
#delimit ;‏ 
هذا يضع AL AG‏ منقوطة كمحدد في نهاية السطرء وبذلك فإن برنامج 
ستاتا يعتبر أن السطر قد انتهى حتى يُصادف الفاصلة المنقوطة. وضع 
الفاصلة المنقوطة كمحدد يسمح للأمر الواحد بأن يمتد لأكثر من سطر واحدء 
Gay‏ يمكننا ضغط مفتاح "إدخال" في لوحة المفاتيح كنهاية معتادة مع أمر 
#delimit‏ آخر: | 
#delimit cr‏ 
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ملاحظة مطبعية: العديد من الأوامر التي تظهر في هذا الفصل على 
الأرجح يتم طباعتها dala‏ ملف do-file‏ بدلا من طباعتها كأمر قائم بذاته في 
نافذة الأوامرء حيث تتم كتابة هذه الأوامر ضمن أوامر البرامج بدون عرض 
نقطة قبلها ”.“ كما تم في المثالين السابقين أعلاه &delimit‏ (ولكن ليس مع 
الأمر do filename‏ والذي يجب كتابته في نافذة الأوامر كما هو معتاد). 
Ado-files‏ 
ملفات Ado-files‏ (التنفيذ الآلي) هي عبارة عن ملفات ASCII‏ تحتوي 
على سلسلة من أوامر ستاتا مثل ملف cdo-files‏ الاختلاف بينها وبين ملفات 
do-file‏ هو أننا لا نحتاج إلى طباعة الأمر do filename‏ حتى نشغل الملف 
cado-file‏ بافتراض Lil‏ قمنا بطباعة الأمر 
.Clear‏ 
كما هو الوضع مع أي أمرء فإن ستاتا يقوم بقراءة ذلك الأمر» وفحص 
ما إذا كان هناك أمر فعلي موجود بهذا الاسم. إذا كان الأمر clear‏ غير 
موجود كجزء من أوامر ستاتا التنفيذية (وفي الحقيقة أنه موجود) فإن ستاتا 
سوف يبحث عن الأمر في قاموسه العادي وهو “ado”‏ محاولاً إيجاذ ملف 
باسم cclear.ado‏ إذا وجد ستاتا الملف GS)‏ يُفترض) Ai‏ يقوم بتنفيذ الأوامر 
التي يحتويها هذا الملف. 
ملفات ado-files‏ لها امتداد ado‏ والبرامج المكتوبة بواسطة المستخدمين 
(التي كتبتها أنت كمستخدم) في العادة يتم حفظها في مجلد باسم 
C:\ado\personal‏ والبرامج المكتوبة بواسطة مستخدمي ستاتا Cys‏ يتم 
حفظها في العادة في المجلد C:\ado\plus‏ ومئات ملفات ado-files‏ الرسمية يتم . 
تثبيتها في المجلد «C:\Program Files\Stata\ado‏ قم بطباعة sysdir‏ لمشاهدة 
قائمة بالمجلدات المستخدمة من قبل برنامج ستاتا الحالي» وقم بطباعة الأمر 
help sysdir.‏ أو help adopath‏ لمعرفة كيفية تعديلها. 
الأمر which‏ يوضح ما إذا كان أمرًا معينا هو في الواقع أمر من أوامر 
ستاتا أو أمر موجود في ملف cado-file‏ وإذا كان pel‏ هو أمر ado-file‏ 
فيحدد مکانه» فمثلاً الأمر summarize‏ من ضمن الأوامر المدمجة:؛ ولكن 
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الأمر ER regress‏ مو :كن الأو Sab‏ المعرفة ado-file Cala:‏ والذي يُسمى 
06 والذي تم تحديثه في أبريل 2011. 


which summarize 
built-in command: summarize 


.which regress 
C:\Program Files\Stata\ado\base\r\regress.ado 
“version 1.3.0 14apr2011 


هذه التفرقة لا تمثل أي شيء لأغلب المستخدمين» GY‏ الأمر summarize‏ 
والأمر regress‏ يعملان بنفس السهولة عند استخدامهما. ودراسة الأمثلة 
واستعارة رمز من آلاف من ملفات ado-files‏ ببرنامج ستاتا يمكن أن تساعدك 
عند البداية في كتابة برنامج cle‏ مخرجات الأمر which‏ أعلاه تعطي موقع 
ملف regress.ado‏ ولمشاهدة الرموز الفعلية في هذا الملف قم بطباعة الأمر 

-viewsource regress.ado 

ملفات 40-5165 C e‏ أوامر التقدير ببرنامج ستاتاء وهذه الملفات 
تطورت بشكل ملحوظء وأصبحت أكثر تعقيداً خلال السنوات الأخيرة حيث 
إنها استوعبت قدرات جديدة ببرنامج ستاتا svy: Sie‏ 
البرام؟ : Programs‏ 


ملفات do-files‏ وملفات ado-files‏ قد يتم اعتبارها أنواعا من البرامج. 
ولكن برنامج ستاتا يستخدم كلمة "ral y;‏ بمعناها الضيق لتعني سلسلة من 
الأوامر يتم حفظها في الذاكرء وتنفيذها من خلال طباعة اسم برنامج معين؛ 
ملفات do-files‏ أو ado-files‏ أو الأوامر تطبع بشكل تفاعلي لتعريف Sia‏ هذه 
البرامج» التعريف يبدأ مع عبارة تحدد اسم البرنامج؛ فمثلا لإنشاء برنامج 
count5 ex‏ نبدأ بطباعة 

Program count5 

الأسطر التالية يُفترض أن تحدد بشكل فعلي البرامج» وأخيرا نعطي أمر 

إنهاء end‏ نتبعه بالضغط على مفتاح الإدخال. 


— 


end 
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عندما يقرأ ستاتا أوامر تعريف البرنامج» فإنه يحفظ تعريف البرنامج في 
الذاكرةء ويبدأ في تشغيله في أي وقت نطبع فيه اسم البرنامج كأمر: 
125 
البرامج تةوم بكفاءة بإنشاء أوامر جديدة متوافرة ببرنامج ستاتاء ولذا فإن 
أغلب المستخدمين لا يحتاجون إلى معرفة ما إذا كان أي أمر يأتي من 
برنامج ستاتا نفسه أو من برنامج -ado-file‏ 
ونحن في صدد البدء بكتابة برنامج cass‏ فإننا عادة نقوم بإنشاء 
إصدارات أولية ناقصة أو غير مكتملةء الأمر program drop‏ مفيد ويسمح 
Lil‏ بمسح برامج من الذاكرة حتى يمكننا تعريف إصدار جديدء فمثلا gal‏ 
برنامج count5‏ من الذاكرة نقوم بطباعة الأمر | 
drop 5‏ 220932331 . 
لمسح كل البرامج (بدون مسح البيانات) من الذاكرة قم بطباعة الأمر: 


-program drop all 


وحدات اطاكرو اطحلية : Local Macros‏ 


clas‏ الماكرو عبارة عن أسماء (تصل إلى 31 حرفا) يمكنها أن ترمز 
لسلاسل أو نتائج رقمية معرفة ببرنامج أو قيم معرّفة للمستخدميز,. وحدة 
الماكرو المحلية موجودة فقط مع البرامج التي Lei xS‏ ولايمكن الإشارة Leal)‏ 
في برنامج c AI‏ ولانشاء وحدة Sls‏ 5 محلية باسم iterate‏ ترمز للرقم 0 قم 
بطباعة الأمر 
local iterate 0‏ 
وللإشارة إلى محتويات ماكرو محلي )0 في هذا المثال) قم بوضع اسم 
الماكرو بين علامة تنصيص فردية» فمثله 
display ‘iterate’‏ 
0 
ولذا فإننا إذا كنا نريد زيادة قيمة iterate‏ بقيمة واحدء Ul‏ نقوم بكتابة الأمر: 
local iterate = ‘iterate' + 1‏ 
display ‘iterate’‏ 
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بدلا من رقم. فإن محتويات الماكرو يمكن أن تكون سلسلة نصية أو 
قائمة من الكلمات مثل: 
local islands Iceland Faroes‏ 
ولمشاهدة محتويات سلسلة نصية يتم وضع علامات تنصيص مزدوجة 
حول اسم الماكرو الذي يجب أن يكون مُحاطا بعلامة تتصيص مفردة: 


display "’ islands ' " 
Iceland Faroes 


يمكننا أن نضع سلسلة إضافية من الكلمات أو أرقام إلى محتويات 
الماكروء فمثلا 


local islands 'islands' Newfoundland Nantucket 
display "'islands'" 
Iceland Faroes Newfoundland Nantucket 


قم بطباعة الأمر help extended fcn‏ للحصول على معلومات أكثر عن 
دوال الماكرو الموسعة ببرنامج ستاتا حيث يقوم هذا الأمر بعرض معلومات 
عن محتويات وحدات الماكروء فمثلا يمكننا الحصول على aac‏ الكلمات في 
الماكروء وحفظ هذا العدد كماكرو جديد thowmany aml‏ 
local howmany: word count ^islands'‏ 


display "howmany' . 
1 . 


العديد من دوال الماكرو الموسعة الأخرى موجودة مع تطبيقات 
للبرمجة. 
وحدات اطاکرو الشاملة : Global macros‏ 


تشبه وحدات الماكرو الشاملة وحدات الماكرو المحلية؛ ولكن عند 
تحديدها فإنها تبقى في الذاكرة» ويمكن استخدامها بواسطة برامج أخرى 
خلال فترة استخدامك لبرنامج ستاتا. وللإشارة إلى محتويات الماكرو الشاملة 
سوف نبدأ باسم الماكرو مع علامة دولار Ya)‏ من إرفاق الاسم في الإسسار 
ويمين علامات الاقتباس كما تم مع وحدات الماكرو المحلية): 


global distance - 73 
display $distance * 2 
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ما لم نحدد بالضبط Wi‏ نريد الاحتفاظ بمحتويات الماكرو لإعادة 
استخدامها dia‏ فإنه من الأفضل (أقل إرباكاً وأسرع في التنفيذ وأقل خطراً) 
استخدام ماكرو محلي بدلا من ماكرو شامل في كتابة البرامجء Cài als‏ 
ماكرو من الذاكرة نقوم باستخدام الأمر macro drop‏ 
macro drop distance‏ 
كما يمكننا حذف كل وحدات الماكرو.من SIM‏ $ عن طريق الأمر: 
macro drop all‏ 


Scalars : oloi 


العدديات يمكن أن تكون أرقاماً أو سلاسل نصية يتم الإشارة إليها 
بواسطة اسم مثل وحدات الماكرو المحليةء ولاسترجاع محتوياتها لا نحتاج 
إلى إضافة اسم العدديّة ضمن علامات الاقتباس» فمثلا: 
scalar onethird - 1/3‏ 
display onethird‏ 
33333333. 
display onethird*6‏ 
2 
العدديات مفيدة das‏ عند حفظ النتائج الرقمية للعمليات الحسابية بدقة 
كاملةء فالعديد من إجراءات برنامج ستاتا التحليلية تحتفظ بالنتائج Jie‏ 
درجات Ap yall‏ وإحصائيات الاختبار» والأرجحيات المسجلة وغيرها 
كعدديات يمكن مشاهدتها بطباعة الأمر return list‏ أو ereturn list‏ بعد إتمام 
عملية التحليل. العدديات ووحدات الماكرو المحلية والمصفوفات والدوال يتم 
حفظها تلقائياً بواسطة برامج ستاتاء وهي تمشل الأساسيات التي يمكن 
استخدامها في البرامج الجديدة. 
الأمر : Version‏ 
قدرات برنامج ستاتا تغيرت خلال فترة من الزمنء وبالتالي فإن كتابة 
البرامج للإصدارات القديمة ببرنامج ستاتا قد لا تعمل بشكل مباشر مع 
الإصدار eladi‏ الأمر version‏ يعمل على حل هذه المشكلة حتى يمكن 
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استخدام البرامج القديمة» فعندما نحدد لبرنامج ستاتا الإأصدار الذي تم 
استخدامة في كتابة البرنامج» فإن ستاتا يقوم بالتعديلات الضرورية حتى 
يمكن للبرنامج القديم العمل مع الإصدار الجديد لبرنامج ستاتاء فمثلا إذا بدأنا 
لير نامج بالعبارة أدناهء فإن برنامج ستاتا يقوم باعتبار كل أوامر البرنامج 
كأنها مكتوبة بإصدار برنامج ستاتا رقم 9. 
version 9‏ 
كتابة version jay!‏ في حد ذاته بدون أي إضافات تقوم بعرض 
الإصدار الحالي لبرنامج ستاتا. 
التعليقان : Comments‏ 
لا يقوم برنامج ستاتا بمحاولة تنفيذ أي سطر يبدأ بعلامة نجمة» مثل هذه 
الأسطر يمكن استخدامها لإدراج تعليقات وشروحات في أي برنامج أو 
عرضها بشكل تفاعلي أثناء العمل على برنامج ستاتاء فمثلا: 
This entire line is a comment.‏ * 
وبدلاً من ذلك» يمكننا إدراج تعليق في السطر الذي يحتوي على الملف 
التنفيذي نفسه» وأبسط طريقة للقيام بذلك تتم بوضع التعليق بعد علامة / 
مزدوجة aa)‏ مسافة واحدة على الأقل قبل علامة / المزدوجة)» فمثلا 


summarize logsize age // this part is the 
comment 


كما يمكن استخدام علامة // ثلاثية (يجب أن يسبقها مسافة واحدة على 
الأقل) تشير إلى أن الذي يتبع هذه العلامات حتى نهاية السطر هو أمرء 
والسطر التالي هو عبارة عن أمر يجب تنفيذه كاستمرار للسطر الأولء 
ead à‏ 
summarize logsize age /// this part is the‏ 

comment 
educ income 
بطباعته كأمر:‎ Lied حيث يتم تنفيذه وكأننا‎ 


summarize logsize age educ income — 
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مع وجود تعليقات أو بدونهاء فإن علامات // الثلاثية تعني أن السطر 
tel cass (UI‏ كاستمرار للسطر السابق: فمثلاً السطرين أدناه سوف نك 
قراعتهما كأمر table‏ واحد حتى بعد فصلهما بواسطة الضغط على مفتاح 
الإدخال: 


table married sex, /// 
contents(median age) 


علامات // الثلاثية تعتبر بديلاً ل didelimit;‏ وهي طريقة تم شرحها 
سابقاً لكتابة أوامر البرامج التي تكون أطول من سطر واحد. 

كما أنه من المحتمل إدراج تعليقات في منتصف سطر الأمر وذلك 
Leia:‏ برق Sab doles ale:‏ 


table married sex, /* this is the comment */ 
contents (median age) 


13 انتهى أحد الأسطر بعلامة */ فإن السطر التالي يبدأ بعلامة /* ثم يقوم 
برنامج ستاتا بتخطي الفاصل بين السطرين ويقرأ كلا السطرين وكأنهما أمر 
واحدء ويُفضل استخدام علامة Il‏ 


Looping : lalsdl 
هناك عدد من طرق إنشاء حلقات البرامج» أحد أبسط هذه الطرق‎ 
.5 فمثلا البرنامج أدناه يقوم بالعد من 1 إلى‎ forvalues تستخدم الأمر‎ 
* Program that counts from one to five 
program count5 
version 12.1 
forvalues i = 1/5 ( 
display `i' 
} 
end 
وبدلا من ذلك‎ counts بطباعة هذه الأوامر نحن نقوم بتعريف ,البرنامج‎ 
لحفظ سلسلة من الأوامر‎ Do-File Editor يمكننا استخدام محرر الملف التنفيذي‎ 
نقوم بطباعة الأمر أدناه الذي يجعل‎ e count5.do exl ASCII على شكل ملف‎ 
برنامج ستاتا يقرأ الملف‎ 


.do count5 
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الطريقة الأخرى تتم من خلال تعريف البرنامج counts‏ وذلك بجعل هذا 


-count5 


جر رخ UC‏ حر U‏ 


الأمر: 
forvalues i - 1/5 1‏ 
يقوم بتخصيص وحدة ماكرو محلية ¡ لأعداد صحيحة متتالية من 1 
وحتى 5» الأمر هو 
display ^i'‏ 
الأمر أعلاه يعرض محتويات الماكروء اسم الماكرو ¡ تم اختياره 
عشو cil‏ وهناك تركيبة أخرى للأمر تسمح لنا بالعد من 0 إلى 100 بفرق 5 
)0« 5« 10« ... 100(: 
forvalues j = 0(5)100 1‏ 
الخطوات بين القيم ليس بالضرورة أن تكون أعداذا صحيحة طالما 
النهاية واحدة» وللقيام بالعد من 4 إلى 5 باستخدام زيادة 0.01 )4.00« 
1 4.02 ... 5.00( نقوم بكتابة: 
forvalues k - 4(.01)5 (‏ 
أي سطر يحتوي على أوامر ستاتا صحيحة بين أقواس البداية والنهاية 
( ) يتم تنفيذها بطريقة متكررة لكل القيم المحددة» وبغض النظر عن 
التعليقات الاختيارية فلا شيء في سطر الأمر يتبع قوس البداية» أما قوس 
النهاية فيتطلب أن يكون هناك سطر خاص به. 
الأمر foreach‏ يستخدم طريقة Yas Ahia‏ من تحديد مجموعة من القيم 
الرقمية التنفيذية»فإننا نقوم بإعطاء قائمة بالعناصر التي يحدث بها التكرارء 
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هذه العناصر يمكن أن تكون متغيرات أو ملفات أو سلاسل نصية أو قيم 
رقمية. ولمعرفة كيفية تركيبة هذا الأمر قم بطباعة -help foreach‏ 
الأمر forvalues‏ والأمر foreach‏ تقوم بإنشاء حلقات وتقوم هذه الحلقات 
بتكرار أرقام محددة مسبقا لمدة مراتء إذا كنا نريد الحلقات أن تستمر حتى 
تحقق شروطأ معينةء فإن الأمر while‏ شوف يكون مفيدًا في ذلك. جزء من 
البرنامج مع الشكل العام أدناه سوف يقوم بشكل متكرر بتنفيذ الأوامر 
الموجودة بين الأقواس المعكوفة ( ) هذا التكرار سوف يستمر طالما أن تقييم 
بر نامج expression‏ "صحيح" "true"?‏ 
while expression 1‏ 
command A‏ 
command B‏ 


} 
command Z‏ 
كما رأينا في المثال السابق» فإن قوس الإقفال ( يجب أن يكون في سطر 
منفصل خاص به وليس في نهاية سطر أي أمر. 
عندما يكون تقييم expression‏ "خطأ" “false”‏ فإن الحلقات تتوقف ويقوم 
برنامج ستاتا بتنفيذ الأمر Z‏ وبنفس ما قمنا به في المثال السابقء فإن التالي 
برنامج مبسط يقوم باستخدام حلقة while‏ التي Oa y‏ على الشاشة تكرار 
الأرقام من 1 إلى 6: 
Program that counts from one to six‏ * 
program count6‏ 
version 12.1‏ 
local iterate = 1‏ 
while ‘iterate’ <= 6 {‏ 
display ‘iterate’:‏ 
local iterate = ‘iterate' + 1‏ 


end 
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الحلقة الأكثر أهمية تظهر في برنامج multicat.ado‏ سوف يتم شرحه 
لاحقا في هذا الفصل. وللحصول على معلومات أكثر عن ذلك قم بالاطلاع 
على دليل المستخدم -Programming Referen :e Manual‏ 
If ... else‏ 
الأمر if‏ والأمر else‏ يحددان لبرنامج ما أن يقوم بشيء واحد إذا كان 
الشرط expression‏ صحيحا ويقوم بشيء Al‏ إذا لم يتوافر هذا الشرط وتتم 
كتابة هذا الشرط كما يلي: 


if expression ( 
command A 
command B 


) 
else ( 
command Z 


فعلى سبيل المثال» هناك جزء في البرنامج أدناه يقوم بفحص ما إذا 
if int(^span'/2) != (^span' - 1)/2 {‏ 
display "span is NOT an odd number"‏ 
} 
else {‏ 
display "span IS an odd number"‏ 


الشروط : Arguments‏ 
البرامج تحدد الأوامر الجديدة» في بعض الأمثلة LS)‏ كان الوضع في 
المثال السابق (countS‏ قررنا أن الأمر سوف يقوم بنفس الشيء بالضبط في 
كل مرة يتم استخدامه. وفي الغالب نحن نحتاج إلى أمر يتم تغييره بواسطة 
شروط مثل أسماء المتغيرات أو الخيارات. هناك طريقتان يمكننا بهما أن 
نحدد لبرنامج ستاتا كيف يقرأ 'ويفهم سطر الأمر الذي يحتوي على شروط 

أسهل هذه الطرق>هي استخدام الأمر args‏ 
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یعرف برنامج يقوم بحساب‎ (listres1.do) أدناه‎ do-file الملف التنفيذدي‎ 
انحدار متغيرين» ثم يضع المشاهدات في قائمة مع أكبر بواقي مطلقةء الأمر‎ 
يعرض عدة أشياء خاطئة مثل استبعاد متغيرات وترك متغيرات‎ 1 
جديدة أخرى في الذاكرة» والتي يمكن أن يكون لها تأثيرات جانبية غير‎ 
مرغوبة. وعموما فإن هذا الأمر يساعد في توضيح استخدام المتغيرات‎ 
` المؤقتة.‎ 
* Perform simple regression and list 
observations with # 
* largest absolute residuals. 
* syntax: 11562651 Yvariable Xvariable # 
IDvariable 
capture drop program listres1 
program listresi1, sortpreserve 
version 12.1 
args Yvar Xvar number id 
quietly regress “Yvar' "Xvar' 
capture drop Yhat 
capture drop Resid 
capture drop Absres 
quietly predict Yhat 
quietly predict Resid , resid 
quietly gen Absres  - abs(Resid ) 
gsort -Absres 
drop Absres 
list ‘id' ^Yvar' Yhat  Resid in 
1/ ` number ' 
end 


السطر args Yvar Xvar number id‏ يحدد لبرنامج ستاتا شروطا لأربع 
وحدات ماكرو. هذه الشروط يمكن أن تكون أرقاما أو أسماء متغيرات أو 
سلاسل نصية أخرى يتم الفصل بينها بمسافة. أول شرط هو استخدام 
محتويات ماكرو محلي اسمه Yvar‏ والثاني ماكرو محلي اسمه Xvar‏ وهكذاء 
بعد ذلك يقوم الأمر باستخدام محتويات وحدات الماكرو هذه في أوامر أخرى 
مثل الانحدار: 
quietly regress ^Yvar' ^Xvar'‏ 
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البرنامج يقوم بحساب قيم البواقي المطلقة (Absres)‏ ثم يستخدم الأمر 
ع (مع علامة ناقص قبل اسم المتغير) لترتيب البيانات من أعلى إلى 
أسفل مع وضع القيم المفقودة في الأخير: 
gsort -Absres.‏ 

الخيار sortpreserve‏ في سطر الأمر يجعل هذا البرنامج 'يحافظ على 
الترتيب" مؤكدا على أن ترتيب المشاهدات هو نفسه بعد تشغيل البرنامج كما 
كان قبل التشغيل. 

ملف البيانات Nations2.dta‏ يحتوي على بيانات 194 دولة تتعلق بنسبة 
انبعاث ثاني أكسيد الكربون CO;‏ لكل شخص )602( والناتج المحلي الإجمالي 
لكل شخص (gdp)‏ واسم الدولة (country)‏ يمكننا فتح هذا الملف واس تخدامه 
لتوضيح البرنامج الجديدء الأمر do‏ يقوم بتشغيل الملف التنفيذي do-file‏ 


المُسمى 11051.40 وبهذه الطريقة يُعرف البرنامج الأمر الجديد :listres]‏ 


.use C:\data\Nations2.dta, clear 
.do C:\data\listres1 


ثم بعد ذلك نقوم باستخدام الأمر الجديد الذي تم تعريفه وهو listres]‏ 
يتبع شروطه الأربعة. الشرط الأول: يحدد المتغير ر والثاني: × والثالث: كم 
عدد المشاهدات التي يجب وضعها في قائمةء والرابع: يُعطي هذه الحالة رقما 
خاصا؛ في هذا المثال أدناه الأمر يقوم بإعداد قائمة بالمشاهدات التي لها 

أكبر قيم بواقي مطلقة. 
.listres1 co2 gdp 5 country‏ 


country 


Qatar 210.65 114.4057 96.2443 
Bahrain 102.65 45.54433 57.10566 


Trinidad/Tobago 89.25 34.18739 55.06261 
Kuwait 118.2 67.839 50.36051 
United Arab Emirates 120.85 79.20002 41.64998 


Phe لیا‎ PN = 





في هذه الدول الخمس المصدرة للنفط انبعاث ثاني أكسيد الكربون لكل 
فرد أعلى من المتوقع. 
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Syntax : pill 


الأمر syntax‏ يُعتبر طريقة معقدة» las oS,‏ مفيدة لقراءة سطر أي 
أمرء الأمر التنفيذي أدناه والمسمى 0 يشْبه الأمر «s‏ ولكن 
يستخدم الأمر syntax‏ بدلا من „args yal‏ 


*Perform simple or multiple regression and list 
*observations with # largest absolute 
residuals. 
*listres2 yvar xvarlist [if] [in], number(#) 
[id (varname) ] 
capture drop program listres2 
program listres2, sortpreserve 
version 12.1 
syntax varlist(min=1) [if] [in], 
Number (integer) [Id(varlist) ] 
marksample touse 
quietly regress ‘varlist' if ‘touse' 
capture drop Yhat_ 
capture drop Resid_ 
Capture drop Absres_ d 
quietly predict Yhat if '"touse' 
quietly predict Resid if '"touse', resid 
quietly gen Absres  - abs(Resid ) 
gsort -Absres 
drop Absres 
list “id' ^1' Yhat_ Resid_ in 1/ ` number ' 
end 


الأمر listres2‏ له نفس وظيفة الأمر listresl‏ حيث يقوم بحساب 
«lass‏ ثم يقوم بإنشاء قائمة للمشاهدات مع أكبر بواقي å illas‏ هذا 
الإصدار الجديد من الأمرء يحتوي على عدة تحسينات» والتي أمكن الحصول 
عليها عن طريق الأمر «syntax.‏ والأمر الجديد غير مقيّد بانحدار ذي 
متغيرين كما حدث في الأمر -listres1‏ الأمر 2 سوف يعمل مع أي 
عدد من المتغيرات التنبؤية Ley‏ فيها تلك التي تكون قيمها المتوقعة تساوي 
متوسط متغيرات ر وبواقيها هي انحرافات من المتوسط. الأمر listres2‏ 
يسمح بخيارات cin y if‏ كما أن استخدام متغير ما shad‏ المشاهدات» وهو 
اختياري مع الأمر. Ya listers2‏ من أن تكون المشاهدات مطلوبة كما كان 
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الوضع مع الأمر distres?‏ فمثلاً يمكننا حساب انحدار انبعاث ثاني أكسيد 
الكربون على الإنتاج المحلي الإجمالي» ونسبة المناطق الحضارية» مع حصر 
التحليل ليشمل الدول في المنطقة 2 فقط وهي دول أمريكا. 


.do C:\data\listres2.do 
.listres2 co2 gdp urban if region == 2, n(5) 
i(country) 


Trinidad/Tobago 89.25 47.63852 41.61148 
Barbados 16.65 35.0574 -18.40739 


Saint Kitts/Nevis 10.05 26.28106 -16.23106 
Antigua and Barbuda 18.3 34.44279 -16.1428 
Suriname 19.45 5.137903 14.3121 


رم WN‏ ضط ي 





سطر الأمر syntax‏ في هذا المثال يوضح بعض السمات العامة للأمر: 


syntax varlist(min-1) [if] [in], Number 
(integer) [Id(varlist)] 


قائمة المتغيرات للأمر listres?‏ يجب أن تحتوي على اسم متغير واحد 
على الأقل «(varlist(min-1))‏ الأقواس n‏ إلى شروط اختيارية» وهي في 
هذا المثال المحددات img if‏ والخيار ( )14ء والحروف الكبيرة الأولى 
للخيارات تشير إلى أقل مشاهدة يمكن استخدامهاء وحيث إن سطر syntax.‏ في 
هذا المثال تم تحديده Number(integer) Id(varlist)‏ والأمر الواقعي يمكن 
كتابته كما يلي: 
.listres2 co2 gdp, number(6) id(country)‏ 
أو يمكن كتابته كما يلي 
-listres2 co2 gdp, n(6) i(country)‏ 
محتويات الماكرو المحلي number‏ يجب أن تكون عدذا صحيحاً id s‏ هي 
أسماء متغير واحد أو أكثر. 
هذا المثال يشرح EN‏ الأمر marksample‏ والذي يجعل العينة الفرعية 
(مثل التي تم تحديدها بواسطة ALU (in y if‏ للاستخدام في تحليلات لاحقة. 
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تركيبة الأمر syntax‏ تم تلخيصها في دليل المستخدم Programming‏ 
Manual‏ فتجربة ودراسة البرامج الأخرى تساعد في فهم هذا الأمر. 
ae alivi‏ البرامة 7 multicat wy‏ (الرسم البياني للعديد من 
اطتعيران النوعية) : Example Program: multicat‏ 

(Plot Many Categorical Variables) 

في الأجزاء السابقة» تم شرح أفكاز بسيطة وأمثلة عن برامج قصيرة. 
في هذا الجزء سوف نطبق هذه الأفكار على برامج أكبر تحدد إجراء 
إحصائيا -multicat awl laa‏ 

وبيانات و اجر اءات البحث الاستقصائي تتضمن العديد من المتغيرات 
النوعية أحياناً قد تصل إلى 100 متغير E‏ أكثرء مقتطفات من الاستطلاع 
الاجتماعي العام لسنة 2010 توفر (ges Vite W‏ مع 9 متغيرا أغلبها 
ردود نوعية على أسئلة الاستطلاع. 


.use C: \data\GSs_ 2010_SwS.dta, clear 
.describe 


Contains data from C:\data\GSS_2010_SwS.dta 





obs: 809 General Social Survey 2010--evolution 
etc. B 
vars: 23 6 Mar 2014 01:41 
size: 34,787. 
storage display value 

variable name type format label variable label 
id int %8.0g Respondent ID number 
year int %8.0g GSS year 
wtssall float %9.0g LABCM probability weight 
cendiv byte 515 . 09 cendiv Census division 
logsize float %9.0g loglO0(size place in 1,000s, +1) 
age byte &8.0g age Age in years 
nonwhite byte $9.0g nonwhite Consider self white/nonwhite 
sex byte &B.0g sex Respondent gender 
educ byte &8.0g educ Highest year of schooling 
married byte *$9.0g yesno Currently married 
income06 byte $15.0g income Total family income 
polviews byte $12.0g polviews Polit views liberal-conservative 
bush byte 59 . و0‎ yesno Voted for Bush in 2004 
obama byte %9.0g yesno Voted for Obama in 2004 
postlife byte %8.0g vesno' Believe in life after death 
grass byte $9.0g grass Should marijuana be legalized? 
gunlaw byte 59 . 0 gunlaw Oppose permit required to buy gun 
sealevel byte %10.0g sealevel Bothered if sea level rose 20 ft 
evolve byte 59 .09 true Humans developed/ earlier species 
recendiv float %9.0g random-effect intercept cendiv 
raneduc float *9 . 09 random-effect slope educ 
toteduc float %9.0g total random + fixed-effect slope educ 
fixeduc float %9.0g fixed-effect slope educ (constant) 


س ل ل ee‏ 


Sorted by: id 
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كخطوة أولى في استكشاف مثل هذا النوع من البيانات أو إعداد تقرير 
تمهيدي» فإننا قد نقوم بإعداد جداول تعرض نسبة التوزيعات لكل متغيرء 
الأمر أدناه سوف يقوم بإنشاء ثمانية جداول لكل المتغيرات الموجودة في 
ملف البيانات من المتغير polviews‏ وحتى المتغير .evolve.‏ 
.tabl polviews - evolve‏ 
عموما برنامج ستاتا لايوفر طريقة سهلة لإنشاء وحفظ الرسم البياني 
للأعمدة لقائمة متغيرات» وكمثال عن البرمجةء فإن هذا الجزء يعرض 
(P Ege‏ ا e‏ العمل مع بحوث 
الدراسات الاستطلاعية الأكثر تعقيد 


برنامج multicat‏ — والذي تم تعريفه بواسطة ملف do-file‏ أدناه — 
والذي تم إنشاؤه elas‏ على برنامج اسمه catplot‏ كتبه مستخدم آخر تم شرحه 
في الفصل 4( catplot zal‏ يمكنه رسم عدد £X‏ من الأشكال البيانية التي 
تعرض توزيعا متغيرًا نوعياء برنامج multicate‏ متخصص أكثر في إنشاء 
الرسم البياني للأعمدة الأفقيةء بحيث تكون هناك نسبة مئوية لكل فئة. ولكن 
هذا التنسيق مفيد لعرض بيانات الدراسات الاستقصائيةء برنامج multicat‏ له 
القدرة على العمل مع قائمة بها عدة متغيرات لا يمكن ل catplot‏ وأوامر 
الرسم البياني الأخرى ببرنامج ستاتا التعامل معها. وبالتاليء يمكننا أن 
نستخدم برنامج multicat‏ في رسم أعمدة بيانية أفقية لكل متغير في البيانات 
الموجودة لديناء وحفظ كل شكل بياني على حدة. البرنامج يحفظ الأشكال 
البيانية بتنسيقين اثنين» الأول بتنسيق ستاتا الذي له امتداد (gph)‏ والثاني 
بواحد من عدة تنسيقات emf, eps, pdf)‏ بناء على نظام التشغيل) وأسماء هذه 
الملفات سوف يكون Sls‏ على أسماء المتغيرات» ويمكنك تغيير أي من هذه 
المواصفات» وذلك من خلال تحرير الملف emulticat.ado‏ وتعديل البرنامج 
بطريقة تلائم احتياجاتك التحليلية. 

*! version 2.0 21jun2012 
*! L. Hamilton, Statistics with Stata (2012) 
* Requires catplot.ado installed. Graphs are 


saved in default directory. 
program define multicat E 
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version 12.1 

syntax varlist [if] [in] [aweight fweight 

iweight] /// | 

[, MISSing BY(varname) OVER(varname) ] 

if "n^over'!" lIa oum { 
display as error "over() option not 
allowed with multicat;" 
display as error "use by() option or try 
catplot command 
instead." i 


exit 198 
} 
marksample touse, strok novarlist 
if "`weight'" != "" local Weighted = 
"Weighted" 
if "`c(os)'"”=="Windows" ( 
local filetype "emf" 
} 
else if "‘c(os)'"=="Unix" + 
local filetype "eps" 
} 


else if "^c(os)'"zz"MacOSX" { 
local filetype = "pdf" 
} 


else { 4 
display as error "unknown operating 
system: "c(os)'" 
exit 799 
} 
capture { 
if "“by'" I= ua { 
foreach var of varlist ‘varlist' { 
local Vlab : variable label "var' 
catplot hbar ‘var' [` weight ' 
"exp'] if ^touse', /// 
blabel(bar, format(%3.0£)) /// 
percent (`by') ytitle("" Weighted ' 
Percent") /// 
"missing' by(^by', 
title("'Vlab '", size(medium))) 
graph save -"by'-^var'.gph, replace 
graph export -"by'-"var'.'"filetype', 
replace 


else ( 
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foreach var of varlist “varlist' { 
quietly tab ‘var' if "touse', "missing' 
local Nofobs = r(N) 
local Vlab : variable label "var' 
catplot hbar ‘var' ['weight' ‘exp'] if 
"touse', /// 
blabel(bar, format (%3.0f)) /// 
percent ytitle("'Weighted ' Percent, 
N = "Nofobs '") /// 
title("^Vlab '", size (medium) ) 
`missing' ` options ' 
graph save Graph -‘var'.gph, replace 
graph export -‘var'.*filetype', replace 
) 
} 
} 
error rc 
end 


المسافة في بداية الأسطر ليس لها تأثير على تنفيذ البرنامج؛ ولكن تجعل 
قراءة البرامج أسهل للمبرمجين» الشيء الجوهري في برنامج multicat‏ هو 
تركيبة جملته «syntax‏ ومن ثم حلقة foreach‏ التي تقوم بشكل متكرر بإعطاء 
أمر catplot‏ لكل متغير في قائمة المتغيرات. وحدات الماكرو المحلية ترسل 
معلومات إلى الأمر eatplot‏ الذي يقوم 'بدوره برسم الأشكال البيانية» الأمر 
يسمح بأوزان تحليلية والتي لها هنا تأثير يشبه تأثير الأوزان الاحتمالية في 
الأمر isvy:tab‏ كما يسمح كذلك بالمحددات df y in‏ وبشكل اختياري يمكننا 
إدراج القيم المفقودة missing‏ و اسبتخدام by()‏ ولكن لايمكننا استخدام -over()‏ 
برنامج multicat‏ تمت كتابته Cus discos‏ تم البدء مع ملف do-file‏ 
اسمه multicatdo‏ وكانت البداية مع إدخال المكونات مثل جملة التركيب» ثم 
بعد ذلك تشغيل هذا الملف لمشاهدة كيف يعمل قبل إضافة أي مكونات 
«s yal‏ ويجب ملاحظة أن تشغيل الملفات التجريبية لا يقوم بإخراج نتائج 

مرضية» قم بطباعة الأمر 
-set trace on‏ 
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حيث يأمر برنامج ستاتا بعرض البرامج خط بخط بنفس ترتيب تنفيذهاء 
Sa all‏ مشاهدة cas cud‏ الخظأ نالك و lis‏ يمكننا أن نقوم بإيقاف 
هذه الميزة بطباعة الأمر 

.Set trace off 

النسخة التمهيدية لملف anulticat.do‏ فإن السطر الأول يحتوي على 
capture program drop multicat‏ مهمته حذف pall‏ نامج من الذاكرة قبل 
تعريفه مرة أخرى» وهذا ضروري في مرحلة الكتابة والتصحيح أوعندما 
تكون النسخة السابقة من البرنامج ناقصة أو غير صحيحةء وعموما فإن مثل 
هذا السطر يجب حذفه عند إتمام كتابة البرنامج. 

عندما نعتقد بأن ملف do-file‏ يقوم بتعريف برنامج نرغب في استخدامه 
مرة أخرىء» فيمكننا إنشاء ملف cado-file‏ ويمكن القيام بذلك من خلال حفظ 
الملف مع امتداد t .ado(multicat. ado)‏ ويُفضل حفظ الملف في المجلد 
0650021 وقد تحتاج إلى إنشاء هذا المجلد إذا لم يكن موجودا ےنا 
يمكن الحفظ في المجلدات الأخرى؛ ولكن يجب مراجعة دليل المستخدم 
User's. Manual‏ لمعرفة ol‏ يبحث ستاتا عن ملفات Sado-files‏ قبل 
الاستمرارء aie y‏ إتمام ذلك فيمكننا استخدام multicat‏ كأمر اعتيادي ضمن 
برنامج ستاتا. 


يمكن تحسين البرنامج لجعله أكثر مرونة وأناقة وسهولة» ويجب ملاحظة أن 
تضمين الأوامر مصدر البرنامج ”2.0 “version‏ في أول سطرين واللذين يبدآن 
بعلامتي !* فهذا الأمر يشير إلى الإصدار الثاني من ملف multicat.ado‏ وليس 
إصدار ستاتا (الإصدار السابق من ملف multicat.ado‏ يظهر في الإصدار السابق 
من هذا الكتاب)؛ إصدار ستاتا المناسب لتشغيل هذا البرنامج تم تحديده على 
أساس أنه الإصدار 12.1 version‏ والذي يظهر في سطور لاحقة في البرنامج» 
بالرغم من أن الأوامر التي تبدأ !* لا تؤثر على الطريقة التي يعمل بها البرنامجء 
إلا أنه يمكن مشاهدتها بواسطة الأمر which‏ ^ 


. which multicat 

.Mnulticat.ado 

*! version 2.0 21jun2012 

*! L. Hamilton, Statistics with Stata (2012) 
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Using Multicat : Multicat &oUy استخحدام‎ 


بعد حفظ الملف S6 a) multicat.ado‏ تم حفظه في المجلد 
(C:\ado\personal‏ فإن الأمر multicat‏ يصبح قابلاً للاستخدام كأنه أن 
أوامر ستاتا العادية uis)‏ وإن لم تكن مكتملة)» الشكل )1.14( يعرض 
إجابات بخصوص وجهات نظر سياسيةء النسب والأرقام للمشاهدات تظهر 
في الرسم البياني. 


emulticat polviews, missing 


Polit views liberal-conservative 


Extreme lib 
Liberal 
Slightly lib 
Moderate 
Slightly con 
Conservative 
Extreme con 


DK/NA 


0 100 200 300 
Percent. N = 809 


x 


الشكل )1.14( 


بيانات الاستطلاع يتم تحليلها عموما باستخدام الأوزان الاحتمالية؛ 
ويجب أن يتم تحديد أن البيانات هي bly‏ استقصائية باستخدام svyset‏ كما 
سبق» وإن تم شرحه في Jail‏ (4)؛ تطبيق الأوزان على البيانات 
الاستقصائية svy: tab‏ يوضح أن الردود أدناه للإجابات عن تشريع اس تخدام 
مخدّر المارجوانا. 

-Svy: tab grass, percent miss a 
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(running tabulate on estimation sample) 








Number of strata  - 1 Number of obs z 809 

Number of PSUs = 809. Population size - 812.73293 
Design df z 808 

Should 

marijuana 

be 

legalized 

percentages 
Key: percentages - cell percentages 


هذا السؤال له نوعان من القيم المفقودة» حوالي %5 من المشاركين في 
الدراسة تم سؤالهم عن مخدر المارجواناء ولكنهم أجابوا بأنهم لا يعرفونه. 
هذه القيم المفقودة تم ترميزها ب a‏ مع توصيفها DK"‏ وحوالي نسبة 
5 في هذه العينة لم يتم سؤالهم عن رأيهم في تشريع استخدام المارجوانا 
grass‏ وهؤلاء تم ترميزهم بالرمز b‏ مع توصيف للقيم ب NA”‏ بيانات 
5 تحتوي على are‏ كبير من الأسئلةء حيث بها أسئلة مختلفة لعينات 
فرعية» ومن ناحية تحليليةء فإن ذلك يجعل للبيانات معنىء حيث يمكننا 
استبعاد المجموعة التي لم يتم سؤالها أسئلة معينة وحساب النسب» وبذلك نجد 
أن هناك انقساماً متساوياً: نحو %46 لصالح تشريع المارجواناء و9646 ضد 
مع وجود نسبة حوالي %8 لم يتخذوا قرارا. 


.Svy: tab grass if grass« .b, percent miss 
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(running tabulate on estimation sample) 


Number of strata z 1 Number of obs = 524 
Number of PSUs = 524 Population size = 526.30952 
Design df $ 523 







Should 
marijuana 
be 

legaiized 
percentages 


Key: percentages = cell percentages 


الأمر gall) multicat‏ تم إنشاؤها بناءً على الأمر Y (catplot‏ يفهم j‏ 4 
مه أو الأوزان الاحتماليةء ولكن الأوزان التحليلية لها نفس الت أثير هناء 
الشكل )2.14( يعرض شكلا ER‏ للأمر multicat‏ يتعلق بالجدول «aD el‏ 
ويُلاحظ بأن الشكل البياني للأمر multicat‏ لاحظ Gl‏ حجم العينة (524). 

smulticat grass if grass« .b [aw = wtssall], miss 


Should marijuana be legalized? 


Legal 


DK 


100 150 200 250 
Weighted Percent, N = 524 = 


الشكل )2.14( 
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هناك سلسلة من عدة أشكال بيانية تشبه الشكل (2.14) تم استبعادها في 
المستند أو الشرائح المعروضة ويمكن قراءتها وإضافة ملاحظات عليها 
بواسطة المحللء وذلك لإجراء عرض سريع للنتائج. وبغض النظر عن 
التعقيد المصاحب للقيم المفقودة لديناء هنا مثال سريع يمكننا من خلاله 
استخدام الأمر multicat‏ لرسم 8 أعمدة بيانية للمتغيرات من المتغير 
polviews‏ إلى المتغير Cus evolve‏ يقوم الأمر بحفظ كل شكل بياني بطريقة 
آلية مع أسماء ملفات colviews.gph Sia‏ ثم يتم بعد ذلك استخدام الأمر 
graph combine‏ لدمج الأشكال البيانية معا في صورة واحدة لتكوّن الشكل 
(3.14). 


.multicat polviews-evolve [aw = wtssall] 
-graph combine -polviews.gph -bush.gph - 
obama.gph -postlife.gph 

-grass.gph -gunlaw.gph -sealevel.gph - 


evolve.gph 
Polit views liberal-conserv Voted for Bush in 2004 Voted for Obama in 2004 
Extr me lib 
p No No 
eer erative Yes Yes 
0 100 200 300 0 50 100 150 200 250 0 200 300 
probability weight Weighted Percent. N = 462 Weighted Percent. N = 517 
Should marijuana be legalizecOppose permit required to buy gun 
No 
Nol Favor 
Yes Legal Oppose 
0 200 40 600 0 50 100 150 200 0 0 200 600 
Weighted Percent. N = 714 Weighted Percent. N = 485 Weighted Percent. ON = 804 
Not at all 
Little 
Somewhat 
Greal deal 


O 100 200 300 400 
Weighted Percent. N = 595 


الشكل )3.14( 


البحوث الاستقصائية تصبح أكثر إثارة عندما نقارن بين المجموعات 
الفرعيةء قمثلاً الفصل المنتظم حول تشريع المارجوانا يظهر بشكل مختلف 
عندما نقوم بتقسيم الإجابات على أساس الجنس في الشكل (4.14). 


-multicat grass [aw = wtssall], by (sex) 
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Should marijuana be legalized? 
Male Female 


Not 





Legal Legal 








0 50 100 150 0 50 100 150 


Weighted Percent 
Graphs by Respondent gender 


الشكل )4.14( 


وفي هذا الشكل» يعرض الأمر NES multicat‏ أكثر عند المقارنة بين 
الأشكال البيانيةء الأوامر أدناه تقوم بإنشاء 8 أشكال بيانية للآراء وتقسيم هذه 
الآراء ely‏ على الجنس ثم تجميع 4 أشكال بيانية في شكل واحد تظهر في 
الشكل )5.14( نرى أن ردود الإناث أكثر gb late‏ هناك حياة بعد الموت 
)86 مقابل %76( كما أنهن يعارضن تشريع تعاطي المارجوانا )57 مقابل 
%43( وهن يساندن تصريح استخدام السلاح )77 مقابل %68( ويرفضن 
الآراء المتعلقة بالتطور البشري )49 مقابل %39( 


amulticat polviews-evolve [aw = wtssall], by (sex) 
.graph combine -sex-postlife.gph -sex-grass.gph - 
sex-gunlaw. gph 

-Sex-evolve.gph 
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Believe in life after death Should marijuana be legalized? 
Male Female Male Female 
No No Not Not 
Yes Yes Legal Legal 
O 100 200 300 400 O 100 200 300 400 0 50 100 150 0 50 100 150 
Welghted Percent Welghted Percent 
Graphs by Respondem gender Graphs by Respondent gender 
Oppose permit required to buy gun Humans developed/ earlier species 
Male Female Male Female 
Favor Favor False False 
Oppose Oppose Tue True 
0 100200300400 O 100200300400 0 50 100150200250 0 50 100150200250 
Welghled Percent Weighted Percent 
Graphs by Reapondent gender k Graphs by Respondent gender 


الشكل )5.14( 


تم استخدام الأمر graph combine‏ في الشكلين )3.14( )5.14( لدمج 
الأشكال البيانية وتوضيح ماقام به الأمر smulticat‏ وفي البحوثء فإن العدد 
الفعلي للأشكال البيانية عادة يفوق ما نريد إدراجه في شكل بياني واحد» 
والأمر multicat‏ يمكنه JS‏ سهولة رسم 100 شكل بياني» ومقارنة إجابات 
المشاركين في الدراسات الاستقصائية من حيث الجنس ثم إجراء 100 مقارنة 
أخرى من Cus‏ مستوى التعليم والفئة العمرية والانتماء السياسي والجغرافي 
وأي تصنيفات أخرى لها أهمية Sis lll‏ أغلب عمليات التحليل سوف لن 
تحتاج إلى هذا الأمر الخاصء ولكن عندما تكون هناك احتياجات معينة في 
بحث ماء فإن البرامج المؤقتة من هذا النوع قد تكون ضرورية. 
ملف امساعدة : Help File‏ 

ملفات المساعدة هي سمة أساسية عند استخدام برنامج ستاتاء فالبرامج 
المكتوبة بواسطة المستخدمين multicat.ado Sia‏ يمكن أن .تصبح أكثر أهمية 
لعدم وجود توثيق خاص بها في دليل المستخدمء ويمكننا كتابة W's‏ مساعدة 
لبرنامج multicat.ado‏ بو اسطة استخدام Do-file Editor‏ لإتشاء ملف نصي 
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Sad) ado-file ala هذا الملف في نفس‎ hia (ya jus multicat.sthlp awl 
.multicat.ado الذي يحتوي على ملف‎ (C:\ado\personal يتم حفظه في مجلد‎ 
أي ملف نصي يتم حفظه في أي مجلد معروف لبرنامج ستاتا بأنه مجلد‎ 
filename.sthlp خاص بملفات 300-16 ويكون الملف النصي المحفوظ بتنسيق‎ 
help سوف يتم عرضه على الشاشة بواسطة ستاتا عند طباعة الأمر‎ 
وحفظ هذا‎ Do-file Editor قد نقوم بكتابة الأمر أدناه في نافذة‎ Sad filename 
ثم نقوم بطباعة الأمر‎ «nulticat.sthlp ea C:\ado\personal الملف في المجلد‎ 
في أي وقت» فإن برنامج ستاتا سوف يعرض النص.‎ help multicat 
multicat -- Multiple bar charts of categorical 
variables) 
multicat varlist [aw = weightvar] [if exp] [in 


range], 
[missing] [by(groupvar)] 


Description 


multicat draws horizontal bar charts showing 
percentages of 

categorical variables. It saves one chart for 
each of the variables. in varlist. Graphs are 
saved in the current default directory, with 
file names based on variable names preceded by 
a hyphen, such as  -vote.gph or  -region- 
vote.gph. They are saved both in Stata's .gph 
format and one other graphical file format 
(.emf, .eps or .pdf) depending on operating 
system. 


Using analytical weights [aw = weightvar] with 
multicat will result in percentages equivalent 
to those obtained by svy: tab applied to data 
declared as survey type, by a command such as 
svyset [pw = weightvar]. The svy: prefix cannot 
be used with multicat itself. Chapter 14 in 
Statistics with Stata 

(2012) has examples and discussion of multicat. 


multicat requires that catplot is installed. 
Type "d 
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findit catplot for instructions on installing 
this unofficial 
program, written by Nicholas Cox. 


Options 
missing includes missing values in the bar 
chart and calculated percentages. 


by(groupvar) draws an image containing separate 
small charts for each value of groupvar. 


Examples 
multicat party wrongtrack vote 
multicat party-vote [aw = weightvar], miss 


multicat party-vote [aw = weightvar], 
by (region) 


References 


Hamilton, Lawrence C. 2012. " 
Statistics with Stata. Belmont, CA: Ceng 


ملفات المساعدة المفيدة هي تلك التي 3 تحتوي على روابط ونصوص 
Cle yes A ais‏ حوار وميزات أخرى يمكن تصميمها باستخدام 
.Stata Markup and Control Language (SMCL)‏ كل ملفات المساعدة الرسمية 
ببرنامج ستاتاء وملفات التسجيل» والنتائج المعروضة على الشاشة تقوم 
باستخدام SMCL‏ والتنسيق المرغوب لملفات المساعدة بصفة عامة موجود 
في دليل الستخدم User's Guide‏ 
النص, أدناه عبارة عن نسخة من SMCL‏ لملف مساعدة خاص 
multia‏ تتبع تقريباً توجيهات دليل المستخدم» وعند حفظ هذا الملف في 
مجلد e multicat.sthlp e ado\personal‏ و بطباعة الأمر help multicat‏ 
سوف يظهر وكأنه ملف مساعدة رسمي. 
(smcl)‏ 


{* *! version 2.0 21ju12012)([(...) 
(cmd:help multicat) 
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DEP WO IR CRIMES ا د‎ "e ARR ERR MEO 


(hline) 


(title:Title) 

(phang) 

(bf:multicat -- Multiple bar charts of 
categorical variables) 


(title:Syntax) 
(p 8 17 12) 
(cmd:multicat) (it:varlist) [(it:weight)] 
[(cmd:if) (it:exp)] 
t >) » ق م«‎ : in} {i 
: , ( ]ع‎ ) 2» 2 8 2 : 


{cmd 


Bo 
Q ب‎ 
ua 


t 

mi 
c 

(title:Description) 


(pstd) 

(cmd:multicat) draws horizontal bar charts 
showing percentages ofcategorical variables. It 
saves one chart for each of the variablesin 
(it:varlist). Graphs are saved in the current 
default directory,with file names based on 
variable names preceded by a hyphen, suchas 
(it:-vote.gph) or {it:-region-vote.gph}. They 
are saved both inStata's .gph format and one 
other graphical file format (.emf, .epsor .pdf) 
depending on operating system. 


{pstd} 

Using analytical weights {cmd: [aw = 
)(it:weightvar)(cmd:]) with 

{cmd :multicat} will result in percentages 
equivalent to those 

obtained by {cmd:svy: tab} applied to data 
declared as survey type,by a command such as 
(cmd:svyset [pw=}{it:weightvar}{cmd:]}. 
The{cmd:svy:} prefix cannot be used with 
(cmd:multicat) itself. Chapter14 i n { b row 
8e 

"http://www.stata.com/bookstore/gtatistics- 
with-stata/index.html": 

Statistics with Stata) (2012) has examples and 
discussion of (cmd:multicat). l 
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(pstd) (cmd:multicat) requires that 
{cmd:catplot} is installed.  Type(cmd:findit 
catplot) for instructions on installing this 
unofficialprogram, written by Nicholas Cox. 


(title:Options) 


(phang) 

(cmdab:miss:ing) includes missing values in the 
bar chart and 

calculated percentages. 


(phang) 

(cmd:by()(it:groupvar)(cmd:)) draws an image 
containing separate 

small charts for each value of (it:groupvar). 


(title:Examples) 


(phang) 
(cmd:. multicat party wrongtrack vote) 


(phang) 
(cmd:. multicat party-vote [aw = weightvar], 
miss) 


(phang) 
(cmd:. multicat party-vote [aw 
by (region) } 


weightvar], 


(title:References) 


{pstd} 

Hamilton, Lawrence C. 2012. 

{browse 
"http://www.stata.com/bookstore/statistics- 
with-stata/index.html": 

Statistics with Stata). Belmont, CA: 
Cengage. {p_end} 


ملف_المساعدة يبدأ — femel)‏ الذي يأمن برنامج ستاتا باعتبار الملدف 
من نوع (SMCL‏ الأقواس المعكوفة () تتضمن رموز SMCL‏ والعديد منها له 
تنسيق {command:text}‏ أو 9145( à n4, (command arguments:text}‏ 
أدناه توضح كيفية تفسير هذه الرموز. 


الإحصاء مع برنامج ستاتا 


يعرض النص Cus «als “help multicat”‏ يعرض 
“help multicat"‏ بأي لون وحروف الخط يتم عرضها 
يعرض النص "Title"‏ كعنوان. 

يقوم بإدراج مسافة بادئة للفقرة النصية التالية. 


age à) Gad مركن‎ 
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(cmd:help 
multicat) 


{hline} 
(title: Title} 
{phang} 


{bf:multicat- ...} 


(81712م) يقوم بتنسيق النص التالي كفقرة مع مسافة بادئة 
بمقدار 8 حروف والسطور التالية مع مسافة بادئة 
7 حرفا والهامش الأيمن يتم تضييقه بمقدار 12 
حرفا. 
(it:varlist]‏ يعرض النص varlist‏ بخط مائل. 
(cmdab:miss:ing)‏ يعرض كلمة “missing”‏ كأمر مع جعل حروف 
a: | als “miss”‏ نار. 
{browse "http://www.stata.com/bookstore/statistics-with-‏ 


stata/index.html" Statistics...) 
(URL) مع موقع‎ “Statistics with Stata” يربط النص‎ 
http://www.stata.com/bookstore/statistics- نت‎ oy! 


with-stata/index.html 
سوق‎ "Statistics with Stata” حيث إن النقر على‎ 


يفتح متصفح الإنترنت على هذا الرابط. 


دليل المستخدم Programming Manual‏ يو فر تفاصيل أكثر عن استخدام 
هذه الأوامرء والعديد من أوامر SMCL‏ الأخرى. 


الفصل الرابع عشر : مقدمة في البرمجة 683 
Monte Carlo Simulation : 9 cugo oly»‏ 

محاكاة مونت كارلو تقوم بإنشاء وتحليل العديد من عينات البيانات 
Arad sll‏ مما يسمح للباحثين بالتحقق من سلوك تقنياتهم الإحصائية في المدى 
الطويل. الأمر simulate‏ يجعل عملية تصميم المحاكاة واضحة وسهلةء حيث 
إنها تتطلب عددا بسيطاً من البرامج الإضافية. في هذا الجزء» سوف يتم 
عرض مثالين عن ذلك. 

عند البداية مع المحاكاة نحتاج إلى تعريف البرنامج الذي يقوم بإنشاء 
عينة واحدة من بيانات عشوائية ثم يحللها ويحفظ النتائج ذات العلاقة في 
الذاكرة. الملف التالي cà y‏ برنامج r-class‏ (قادر على hia‏ نتائج ( ):) باسم 
meanmedian‏ هذا البرنامج يقوم عشوائيا بإنتاج 100 قيمة للمتغير x‏ من 
توزيع طبيعي معياريء ثم يقوم بإنتاج 100 قيمة للمتغير س من توزيع 
طبيعي ملوّث: N(0,1)‏ مع احتمالية 0.95 و N(0,10)‏ مع احتمالية 0.05« 
التوزيعات الطبيعية الملوثة يتم. استخدامها في العادة في دراسات المتانة 
لمحاكاة المتغيرات التي.تحتوي على أخطاء شاذة عرضية»ء بالنسبة لكلا 
المتغيرين» فإن agi meanmedian‏ بحساب المتوسطات وقيم الوسيط. 


* Creates a sample containing n=100 
observations of variables x 
and w. 
* x-N(0,1) x is standard 
normal 
* w-N(0,1) with p=.95, w-N(0,10) with p=.05 w 
is contaminated 
normal 
* Calculates the mean and median of x and w. 
* Stored results: r(xmean) r(xmedian) r(wmean) 
r(wmedian) 
program meanmedian, rclass 
version 12.1 
drop all 
set obs 100 
generate x - rnormal() 
summarize x, detail 
return scalar xmean - r(mean) 
return scalar xmedian - r(p50) 
generate w - rnormal() ١ 
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replace w = 10*w if runiform() « .05 
summarize w, detail 
return scalar wmean - r(mean) 
return scalar wmedian = r(p50) 
end 


meanmedian Uie WY ,‏ كأمر r-class‏ مثل summarize‏ الذي يمكنه 
أن يحفظ نتائجه في قيم عددية ( asi meanmedian <r)‏ بإنشاء أربع قيم 
عددية r(xmean)‏ و r(xmedian)‏ لمتوسط ووسيط المتغير € ونفس الشيء 
لمتوسط ووسيط المتغير w‏ حيث تكون .r(wmean), r(wmedian)‏ 

عند تعريف meanmedian‏ سواء باستخدام do-file‏ أو ado-file‏ أو من 
خلال طباعة الأوامر بشكل «dels‏ يمكننا أن نستخدم هذا البرنامج مرة 
أخرى من خلال الأمر «simulate‏ ولإنشاء بيانات جديدة تحتوي على 
المتوسطات وقيم الوسيط للمتغير x‏ والمتغير .رمن 5,000 عينة عشوائية 
نقوم بطباعة الأمر التالي: 


.simulate xmean = r(xmean) xmedian = r(xmedian) 
wmean = r(wmean) wmedian =  r(wmedian), 
reps(5000): meanmedian 


command: meanmedian | 
xmean: r(xmean) 

xmedian: r(xmedian) 
wmean: r(wmean) 

wmedian: r(wmedian) 


Simulations (5000)‏ 
هذا الأمر يقوم بإنشاء المتغي ر أت xmean, xmedian, wmean, wmedian‏ 


meanmedian على نتائج (): من كل تكرار ل‎ ely 


: 
-describe 
Contains data 
obs: 5,000 simulate: meanmedian 
vars: 4 27 Mar 2014 22:50 
size: 80,000 
storage display value 
variable name type format label variable label 
xmearn float *"«9.0g r (xmean) 
xmecdian float و0 . 9ه‎ . Y(xmedian) 
wmean float  &9.0g ^ xr (wmean) 
wmedian float $9.0g r(wmedian) 
Sorted by: d 


. summarize 
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Variable Obs Mean Std. Dev. Min Max 
xmean 5000 -.0023419 .1011693 - 9 . 5 
xmedian 5000 -.0014787 .1251765 -.4686761 .5143458 
wmean 5000 -.002392 .2431499 -.994046 .905769 
wmedian 5000 .0010861 .1282183 -.5034871 .4793077 


المتوسطات لهذه المتوسطات وقيم الوسيط خلال 5000 عينة كلها 
تقريباً قريبة للصفرء وتتوافق مع توقعاتنا بأن متوسط ووسيط العينة بُفترض 
أن يوفرا تقديرات غير متحيّزة لمتوسطات المجتمع الصحيح )0( للمتغير x‏ 
Sy cy dall,‏ هو oly plas ai gin‏ فلن المفوسط py‏ أقل تبايناً من الوسيط 
من عينة لأخرى عند تطبيقه على متغير x‏ موزع توزيعاً طبيعياء الانحراف 
المعياري للمتغير xmedian‏ يساوي 5 وهو أكبر بدرجة كبيرة من 
الانحراف المعياري (0.101). ومن ناحية أخرىء فعند تطبيقه على متغير w‏ 
عين Aly aida J ganda‏ بالق ci dd ral‏ سكين Gaia cy Ss‏ 
الانحراف المعياري للمتغير 7 أقل بكثير من الانحراف المعياري 
للمتغير wmean‏ )0.128 مقابل 0.244(« تجربة مونت كارلو توضح بأن 
اللي يق اا مستقر! Gua‏ للمركز بالرغم من وجود القيم المتطرفة 
الشاذة في التوزيع الملوّث» بينما المتوسط ينخفض ويتنوع بشكل كبير من 
عينة لأخرى» الشكل )6.14( يعرض مقارنة بيانية للشكل الصندوقي 
(وبالصدفة يعرض كيفية التحكم في أشكال الصندوق البيانية وعلامات القيم 
المتطرفة)ء ولإنشاء مسافة لأربعة متغيرات في مربع شرح لصف واحدء 
فسوف نقوم برسم الرموز بنصف حجمها الواقعي -(symxsize(*.5))‏ 


.graph box xmean xmedian wmean wmedian, 
yline(0) 


legend(row(1) symxsize(*.5)) 


marker(1, msymbo] (+) ( marker(2, 
msymbol (Th) ) 


marker(3,.msymbol(Oh)) marker(4, 
msymbol (Sh) ) 
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الشكل )6.14( 


مثالنا التالي يوسّع التحقق إلى طرق الثقة جامعا معأ عدة موضوعات 
من هذا الكتاب. برنامج regsim‏ يقوم بإنشاء 100 مشاهدة للمتغير x‏ 
(الطبيعي القياسي) ومتغيرين اثنين ل y‏ حيث إن y]‏ هو دالة خطية للمتغير 
asd x‏ الأخطاء الطبيعية المغيارية 2نراهو Alla Load‏ خطية للمتغير + ولكن 
يضيف الأخطاء الطبيعية الملوثة» هذه المتغيرات تساغد في اكتشاف سلوك 
عدة طرق انحدار في وجود توزيعات طبيعية وغير طبيعية لها أخطاء ذات 
خطأ ذو انحراف كبير في منحنى التوزيع الطبيعي» تم استخدام أربع طرق 
هي: 

المربعات الصغرى العادية «(regress)‏ والانحدار الموثوق (reg)‏ 
والانحدار الربيعي (greg)‏ والانحدار الربيعي مع الأخطاء المعيارية 
المتكّسة bootstrapped standard errors‏ (الأمر bsqreg‏ 500 تكرار)؛ 
الموثوقية والانحدار الربيعي (الفصل .8( نظريا يجب أن يُثبت مقاومة أكثر 
لتأثيرات القيم المتطرفةء ومن خلال تجربة محاكاة مونت كارلو نقوم باختبار 
ما إذا كان ذلك صحيحاء الأمر regsim‏ يقوم بتطبيق كل طريقة لانحدار 
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المتغير yl‏ على المتغير × ثم بعد ذلك على انحدار المتغير y2‏ على المتغير 
ده وفي هذا التمرين سوف يتم تعريف البرنامج عن طريق ملف ado-file‏ 
| المسمى regsim.ado‏ والذي تم ahia‏ في المجلد -adoWersonal‏ 


program regsim, rclass | 

* Performs one iteration of a Monte Carlo | 
simulation comparing 

* OLS regression (regress) with robust (rreg) 1 
and quantile 1 

* (qreg and bsqreg) regression. Generates one n | 
= 100 sample | 

* with x ~ N(0,1) and y variables defined by | 
the models: 

* I 

* MODEL 1: y1 = 2x + el e1 ~ N(0,1) 

* 

* MODEL 2: y2 = 2x + e2 e2 - N(0,1) with p = 
.95 

* e2 ~ N(0,10) with p = .05 

x 

* Bootstrap standard errors for qreg involve 
500 repetitions. " 

* 

version 12.1 

if "17 == "9n i 

global S 1 "b1 bir selr bliq selq selqgb /// 

b2 b2r se2r b2q se2q se2qb" 

exit 

} 

drop _all 

set obs 100 

generate x rnormal() 

generate e rnormal() 

generate yl - 2*x + © 


reg yl x 

return scalar 81 = _b[x] 
rreg yi x, iterate(25) 
return scalar BIR = _b[x] 
return scalar SEIR = _se[x] 
qreg 3771 x 

return scalar B1Q = _b[x] 
return scalar SE1Q = _se[x] 
bsqreg y1 x, reps(500) 
return scalar SE1QB = _se[x] 


replace e = 10 * e if runiform() < .05 
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generate y2 - 2*x + e 


reg y2 x 

return scalar B2 =  bIx] 
rreg y2 x, iterate(25) 
return scalar 32R = _b[x] 
return scalar SE2R = _se[x] 
qreg y2 x 

return scalar B2Q = _b[x] 
return scalar SE2Q -  se[x] 
bsqreg y2 x, reps(500)- 
return scalar SE2QB =  se[x] 
end 


برنامج r-class‏ يقوم بحفظ تقديرات الأخطاء المعيارية والمعاملات من 
ثمانية تحليلات انحدارء والنتائج يتم إعطاؤها أسماء مثل: 
(81)” معامل من انحدار OLS‏ للمتغير y]‏ على المتغير x‏ 
r(BIR)‏ معامل من الانحدار الموثوق للمتغير y]‏ على المتغير x‏ 
r(SEIR)‏ الخطأ المعياري لمعامل الثقة من النموذج 1 


وهكذاء كل انحدارات الربيعات وانحدارات الثقفة تتضمن تفاعلات 
متعددة: bale‏ من خمسة إلى عشرة تفاعلات للأمر s rreg‏ وحوالي خمسة 
qreg gov‏ وعدة آلاف للأمر es bsqreg‏ 500 إعادة تقدير متكيسة لحوالي 
خمسة تفاعلات لكل «Aue.‏ ولهذا فإن Gian Ld‏ واحذا للبرنامج e sin regsim‏ 
بتحديد أكثر من 2,000 «laa‏ والأمر أدناه يحدد خمسة تكرارات تتطلب 
أكثر من 10,000 انحدار. 

.Simulate b1 = r(B1) bir = r(B1R) seir = r(SE1R) 

biq = r(B1Q) selq = r(SE1Q) selgb = r(SE1QB) 

b2 = r(B2) 

b2r = r(B2R) se2r = r(SE2R) b2q = r(B2Q) 

se2q = r(SE2Q) 

se2qb = r(SE2QB), reps(5): regsim 
تشغيل محاكاة بسيطة مثل التي قمنا بها أعلاه ه كتجربة‎ à قد تريد إعادة‎ 
المطلوب على جهاز الكمبيوتر لديك. وعموماء فإننا قد نحتاج‎ c لمعرفة الزمن‎ 
يحتوي على نتائج‎ regsim.dia إلى زمن أطول للتجارب الأكبر؛ ملف البيانات‎ 


من تجربة تضمتت 500 تكرار لبرنامج regsim‏ وهي أكثر من مليون 
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انحدارء مُعاملات الانحدار وتقديرات الخطأ المعياري التي تم الحصول عليها 
من هذه التجربة تم تلخيصها في الجدول أدناه. 











.describe 
Contains data from C:\data\regsim.dta 
obs: 500 Monte Carlo estimates of b in 500 
samples of n-100 
vars: 12 2 Jul 2012 06:11 
size: 24,000 
Storage display value 
variable name type format label variable label 
bl float %9.0g r(Bl1) 
bir float %9.0g - r (BIR) 
selr float %9.0g r (SEIR) 
biq float $9.0g r(B1Q) 
selq float $9.0g r(SE1Q) 
selqb float %9.0g r (SE1QB) 
b2 float %9.0g r(B2) 
b2r float $9.0g r (B2R) 
se2r float %9.0g r(SE2R] 
b2q float 59.09 r(B2Q) 
se2q float %9.0g r(SE2Q) 
se2qb float %9.0g r(SE2QB) 
Sorted by: 


. summarize 


Variable 











Min Max 


1.99586 -104467 1.692893 2.293595 





bir 500 1.996901 .1077322 1.698501 2.294482 
selr 500 .1046559 .0108543 .0789753 .1523494 
biq 500 1.99658 .1246462 1.638891 2.370703 


.13393 . 0206363 . 0801532 . 7 








. 1 .0321417 .0532386 .2581546 


b2 500 1 986367 - 2604184 1.066318 2.90484 
b2r 500 1.997187 .1127494 1.674992 2.307488 
se2r 500 .1087309 .0117741 . 081064 .1564037 


1.996925 .1314325 1.591606 2.370703 










.1416007 -0212944 .0880669 .2220859 
500 .1456451 .0343871  ..0560117 .2704635 





se2qb 
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T باس تخدام‎ E Gel» il قابلاً‎ uu مربع شرح‎ 

legend(symxsize(*.3) colgap(*.3))‏ والذي يقوم بتوسيع الرموز والفراغات 

بين الأعمدة في مربع شرح الرسم» بحيث تظهر بحجم %30 من حجمها 

الافتراضي» الأمر help legend option‏ و الأمر help relativesize‏ يعرضان 
معلومات أكثر عن هذه الخيارات. 

. graph box 1ط‎ bir big b2 b2r b2q, 

ytitle("Estimates of slope (b-2)") 

yline(2) legend(row(1) symxsize(*.3) 

colgap(*.3) 

label(1 "OLS 1") label(2 "robust 1") label(3 

"quantile 1") 

label(4 "OLS 2") label(5 "robust 2") label(6 

"quantile 2")) 


Estimates of slope (b=2) 
2 25 


1.5 





الشكل )7.14( 


نماذج الانحدار الثلاثة OLS)‏ والموثوق والربيعي) أنتجت معامل متوسط 
يقوم بتقدير النموذجين» وهذه التقديرات ليست مختلفة معنويا عن اانيمة 

الصحيحة 2 حم » ويمكن تأكيد هذا من خلال اختبارات ؛ مثل: 
.ttest b2r = 2‏ 
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One-sample t test 









Variable Obs Mean Std. Err. Std. Dev. (95% Conf. Interval) 












1.987281 2.007094 





500 1.997187 .0050423 .1127494 






mean - mean(b2r) t = -0.5578 

Ho: mean = 2 degrees of freedom = 499 
Ha: mean < 2 Ha: mean != 2 Ha: mean > 2 

Pr(T « t) = 0.2886 Pr(|T| > |t|) = 0.5772 Pr(T > t) = 0.7114 


كل نماذج الانحدار تعطي تقديرات غير متحيزة ل B‏ ولكن تبايناتها 
وكفاءتها تختلف من عينة لأخرى. وعند تطبيقها. على نموذج الأخطاء 
الطبيعية 1 فإن OLS‏ يُثبت بأنه الأكثر فعاليةء وذلك كما توقعت نظرية 
جاوس ماركوف cGauss-Markov.‏ كما أن الانحراف المعياري المشاهد 
لمُعاملات OLS‏ يساوي 0.1045 مقارنة مع 0.0177 للانحدار الموشوق 
و1246 .0 للانحدار الربيعي؛ والكفاءة النسبية والتي تعرض التباين المشاهد 
لمعامل OLS‏ كنسبة من تباين MA‏ آخر تعتبر طريقة معيارية لمقارنة in‏ 
هذه الإحصائيات: 


. quietly summarize b1 

. Scalar Varbi = r(Var) 

. quietly summarize bir 
display 100*(Varb1/r(Var)) 

94. 030265 


. quietly summarize big 
. display 100*(Varb1/r(Var)) 
70.242519 


الحسابات أعلاه تستخدم نتيجة تباین r(Var)‏ من الأمر «summarize‏ 
سوف نقوم أولاً بالحصول على تباين تقديرات OLS‏ للمتغير /5 ثم نجعل تلك 
القيمة قيمة عددية carb]‏ بعد ذلك يتم uas‏ على تباينات التقديرات 
الموثوقة bir‏ وتقديرات الربيعات big‏ ومقارنتها مع Karb]‏ هذا يوضح أن 
الانحدار الموثوق كان lugi‏ 4 كفء مثل كفاءة 01.5 عند تطبيقه على 
نموذج الأخطاء الطبيعية وهو قريب من نسبة كفاءة العينة الكبيرة %95 
وهذه هي الطريقة التي يُفقترض أن تكون موثوقة نظريا Hamilton)‏ 31992)؛ 
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وفي المقابل؛ فإن الانحدار الربيعي يحقق كفاءة نسبية قدرها %70 تقريباً مع 
نموذج الأخطاء الطبيعية. 

حسابات Ailes‏ لنموذج الأخطاء الملوثة يعطي صورة مختلفة» حيث إن 
5 كان أفضل (الأكثر كفاءة) مقر مع الأخطاء الطبيعية» ولكنه قد يكون 


. quietly summarize 2 

. scalar Varb2 = r(Var) 

. quietly summarize b2r 
display 100*(Varb2/r(Var)) 

533. 47627 l 


. quietly summarize b2q 
. display 100*(Varb2/r(Var)) 
392.58875 


القيم المتطرفة في نموذج الأخطاء الملوثة يؤدي بأن تكون تقديرات 
معاملات OLS‏ متباينة بشكل كبير من عينة لأخرى. والذي يمكن ملاحظته 
بوضوح في الصندوق الرابع بالشكل )7.14( تباين مُعاملات OLS‏ أكبر 
خمس مرات من التباين المتعلق بالمُعاملات الموثوقة» وأكبر بأربع مرات 
تقريبا من المُعاملات الربيعية. وبعبارة أخرى فقد تم إثبات أن الانحدار 
الربيعي؛ والانحدار الموثوق كلاهما أكثر استقراراً من OLS‏ في وجود القيم 
المتطرفة bhaa‏ في المقابل أخطاء معيارية أقل وفترات هة أضيقء 
والانحدار الموثوق يتفوق على الانحدار الربيعي مع نماذج الأخطاء الطبيعية 

ونماذج الأخطاء الملوثة 
الشكل )8.14( يعرض مقارنة بين OLS‏ والانحدار الموشوق عارضا 
شكل انتشار ل 500 زوج من معاملات الانحدار. معاملات 01.5 (المحور 
العمودي) يتباين ASÍ‏ بكثير حول القيمة الصحيحة "2.0" أكثر من معاملات 

rreg‏ (المحور الأفقي). 
b2r,.msymbol (dh)‏ 2ط graph twoway scatter‏ . 


ylabel(1(.5)3, grid) 


yline(2) xlabel(1(.5)3, grid gmin gmax) 
xline(2) 
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ytitle("OLS regression coef, contaminated 
errors") 

xtitle("Robust regression coef, 
contaminated errors") 


3 


1.5 2 2.5 


OLS regression coef, contaminated errors 


1 





1.5 2 2.5 
Robust regression coef, contaminated errors 


الشكل )8.14( 


كما أن تجربة مونت كارلو تعرض معلومات حول الأخطاء المعيارية 
المقدرة في ظل كل طريقة وكل نموذج. متوسط الأخطاء المعيارية المقدرة 
يختلف عن الانحراف المعياري المشاهد للمُعاملات. والاختلاف بين الأخطاء 
المعيارية الموثوقة بسيط نسبياًء حيث إنه أقل من %4 ونظرياً فإن اختلافات 
lai‏ المعياز ةا co duel‏ كيت Ugh‏ 967 قربا cd uni‏ الفقيولينة 
الصغرى تبدو أخطاء ربيعية متكيّسة تم الحصول عليها بواسطة الأمر 
cbsqreg‏ ومتوسطات الأخطاء المعيارية المتكيّسة تفوق الانحراف المعياري 
المشاهد للمتغير big‏ والمتغير 529 بحوالي 10 أو %11 ويبدو أن التكيّس 
يُبالغ في تقدير التباين من goad Aue‏ 

محاكاة مونت كارلو أصبحت إحدى الطرق الرئيسة في البحوث 
الإحصائية الحديثةء كما أنها تلعب دورا متزايدًا في التعليم الإحصائي» هذه 
الأمثلة توضح بعض الطرق Algal:‏ لمعرفة طريقة استخدامها. 
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برمجه امطصفوفات Matrix Programming with Mata : Mata £v‏ 
لغة برمجة المصفوفات ببرنامج ستاتا تسمى «Mata‏ وتم شرحها 
بالتفصيل في إصدارين بدليل المستخدم «Mata Matrix Programming‏ هذا 
الموضوع الضخم لا يقع ضمن نطاق هذا الكتاب» ولكن يتناسب مع هذا 
الفصل الختامي» حيث سنلقي نظرة سريعة على Mata‏ حيث إن أدواته 
البرمجية تفتح مجالات جديدة لتطوير ستاتا. 
Yan‏ من قضاء فترة طويلة في شرح مفاهيم Mata‏ ومميزاتهاء سوف 
fas‏ مباشرة مع أمثلة عن كيفية كتابة برنامج يقوم Glass‏ انحدار المربعات 
الصغرى 01,5» Cus‏ إن نموذج الانحدار البسيط هو: 
y=Xb+u‏ 
حيث إن y‏ هي (0x1)‏ موجه عمودي لقيم المتغير التابع» × هي (n*K)‏ 
مصفوف تحتوي على قيم (ale)‏ ۸-1 متغيرات تنبؤية وعمود u «d‏ هي 
(7x1)‏ موجه الأخطاءء b‏ هي (kx1)‏ موجه مُعاملات الانحدار ويتم تقديرها 
كما يلي: 
b = (X'X)' X'y‏ 
هذه الطريقة لحساب المصفوفة مألوفة لأجيال من طلبة الإحصاء. 
وتعتبر نقطة بداية مفيدة لمشاهدة كيفية عمل Mata‏ 


ملف البيانات creactor.dta‏ يتضمن معلومات حول تكاليف إيقاف تشغيل 
خمسة مفاعلات طاقة نووية تم إقفالها في الفترة من 61982-1968 الميزة 
التعليمية في هذا المثال هي صغر حجم المصفوفاتء حيث يمكن كتابتها 
بسهولة على السبورة أو الورق في حالة الحاجة إلى ذلك eg, Hamilton‏ 
0 » فسوف تتم معرفة كيف أن تكاليف إيقاف التشغيل قد تكون لها 
علاقة مع قدرة المفاعل وسنوات التشغيل. 
use C:\data\reactor.dta, clear‏ . 
describe :‏ . 
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Contains data from C:\data\reactor.dta 








obs: 5 Reactor decommissioning costs (from 
Brown et al. 1986) 
Vars: 6 2 Jul 2012 06:11 
size: 110 
Storage display value 

variable name type format label variable label 
site strl4 65 Reactor site 
decom byte %8.0g Decemmissioning cost, millions 
capacity int %8.0g Generating capacity, megawatts 
years byte %9.0g Years in operation 
start int $8.09, Year operations started 
close int 58.09 Year operations closed 





Sorted by: start 


وبالطبع» فإن حساب انحدار OLS‏ مع برنامج ستاتا سهل dace‏ حيث 
وجدنا أن تكاليف إيقاف التشغيل لهذه الخمسة مفاعلات زادت بحوالي 0.176 
مليون دولار )175,874 دولارًا) لكل ميجاوات قدرة على التوليد» وحوالي 
9 مليون دولار لكل سنة تشغيل. هذان المتغيران التنبؤيان يوضحان 
حوالي %99 من تباين تكاليف إيقاف التشغيل .(R^,70.9895)‏ 


. regress decom capacity years 
























Source Number of obs - 5 
F( 2. 2) = 189.42 

Model 4666.16571 2 6 Prob > F = 0.0053 
Residual 24.6342883 2 12.3171442 R-squared = 0.9947 
Adj R-squared = 0.9895 

Root MSE = 3.5096 


(95% Conf. Interval} 


capacity ",1758739 - 0247774 7.10 0.019 .0692653 .2824825 
years 3.899314 .2643087 14.75 0.005 2.762085 5.036543 
_cons -11.39963 4.330311 -2.63 0.119 -30.03146 7.23219 
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ملف 300-516 أدناه يُعرّف برنامج Lais Sls‏ أوامر «Mata.‏ وهو 
ببساطة يقوم بحساب موجه معاملات الانحدار cb‏ في هذا المثال أوامر Mata‏ 
تبدا ب mata:‏ (هناك عدة طرق أخرى لاستخدام هذه الأوامر Ule ls‏ أو i‏ 


برامج تم شرحها في دليل المستخدم)؛ أول أمرين اثنين mata:‏ يقومان 
بتعريف الموجّه y‏ والمصفوفة X‏ كمعاينة للبيانات في الذاكرة وتم تحديدها 
بواسطة كل المتغيرات في الطرف الأيسر (lhs)‏ والمتغيرات في الطرف 
الأيمن (rhs)‏ التي تظهر سطر الأمر cols0‏ الثابت 1 يشكل آخر عمود في 
المصفوفة X‏ كما أن 0ءاه يسمح بالمحددات im‏ أو ۴¡ أو القيم المفقودة. 


والمعادلة المقدآرة هي: 
b -(X'X)' X'y‏ 
ويتم كتابتها بلغة Mata‏ على الشكل التالي: 
mata: b = invsym(X'X)*X'y‏ 


أمر mata:‏ الرابع يعرض محتويات النتائج للمتغير b‏ 


*| 21jun2012 


*! L. Hamilton, Statistics with Stata (2012) 


program olsO 


version 12.1 

syntax varlist(min=1 numeric) [in] [if] 
marksample touse 

gen cons_ = 1 

tokenize ‘varlist' 

local lhs "^1'" 

mac shift 

local rhs "^*s*'" 

mata: st view(y-., ., "‘lhs'", ""touse'") 


mata: st view(X-., ., (tokens(""rhs'"), 
"cons "), "^touse'") 


mata: b - invsym(X'X)*X'y 
mata: b 
drop cons 


end HET 
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وعند تطبيق 0160 على بيانات إيقاف تشغيل المفاعلات النووية فإن 


معاملات الانحدار التي تم الحصول عليها تشبه تلك التي تم الحصول عليها 
سابقا بو اسطة الأمر .regress‏ 


. 01850 decom capacity years A 


1 - 1758738974 
2 3.899313867 
3 -11.39963279 





عند ١‏ ستخدام إصدارات Mata‏ للمعاد لات المعياريةء فإن برنامج olsi‏ (في 
الصفحة التالية) يقوم بإضافة حساب الأخطاء المعيارية وإحصائيات : 
واحتمالات اختبار /» ومرة أخرى نرى أن الحسابات تقود إلى نفس النتائج 
التي رأيناها سابقا مع الأمر cregress‏ الفواصل في Al‏ عبارة mata‏ ببرنامج 

1 هي عبارة عن عوامل وتعني 'قم بضم الأعمدة للمصفوفات التالية". 
21jun2012‏ !* 
L. Hamilton, Statistics with Stata (2012)‏ !* 
program olsi‏ 

version 12.1 

syntax varlist(min=1 numeric) [in] [if] 

marksample touse 

gen cons = 1 

tokenize ‘varlist' 

local 125 "^1'" 

mac shift 

local rhs "',*'" 

mata: st_view(y=., ., "'lhs'", "^touse'") 

mata: st view(X-., vr (tokens(""rhs'"), 

"ConS, "), ""touse'") 


mata: b - invsym(X'X)*X'y 
mata: e - y - X*b 
mata: n - rows(X) 
mata: k = cols(X) 


mata: s2 - (e'e)/(n-k) 
mata: V = s2*invsym(X'x). 
mata: se - sqrt(diagonal(V)) 
mata: (b, se, b:/se, 2*ttail(n-k, 
abs(b:/se))) 
drop cons 
end 
. 0151 decom capacity years 
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1 2 3 4 


1 .1758738974 .0247774037 7.098156835 .0192756353 
2 3.899313867 .26430873 14.75287581 . 00456317 
3 -11.39963279 4.330310729 -2.632520735 .1190686843 





يمكننا أن نوسع هذا cua ili‏ بحيث يحفظ النتائج ويعرضها في جداول 
ذات تنسيق أفضل يشبه تلك التي يعرضها الأمر cregress‏ البرنامج 0162 csi)‏ 
الصفحة (an‏ يقوم بشيء مختلف حتى يوضح كيف أن Mata‏ تضم 
المصفوفات cla‏ دوت Pap‏ بدمج النتائج الرقمية المعروضة أعلاه في 
مصفوفات نصية تحتوي على عناوين للأعمدة وقائمة بأسماء المتغيرات 
المستقلة» ويتم القيام بذلك من خلال أوامر mata‏ إضافيةء أحد هذه الأوامر 
يُعرّف موجه الصف vnames_‏ والذي يحتوي على قائمة بأسماء المتغيرات. 
الفواصل في هذا الأمر تقوم بضم ثلاث مجموعات من الأعمدة: (1) العبارة 
“Yvar:”‏ يتبعها اسم المتغيرات بالطرف الأيسر» )2( أسماء كل متغيرات 
الطرف الأيمنء )3( العبارة cons"‏ * 
mata:vnames z"Yvar: lhs'",tokens(""rhs'")," cons"‏ 
أمر mata.‏ الطويل التالي يقوم باستخدام محدد التعليقات الموجودة ضمن 
سطر الأمر وهي */ و/* حتى يستطيع Mata‏ قراءة ما قبل نهاية آخر سطرين 
ويعتبر هذا كله كأمر واحد: 


mata: vnames ', ("Coef." \ strofreal(b)), /* 
*/ ("Std. Err." ١ strofreal(se)), /* 
*/  ("t" v strofreal(t)), ("P»|t|" ١ 
strofreal(Prt)) 


الأمر يعرض مصفوفة بها الصف الأول عبارة عن أسماء vnames‏ 
(وهو عمود أسماء المتغيرات). عمود أسماء المتغيرات مدمج باس تخدام 
فاصلة مع موجه العمود الثاني الذي تم إنشاؤه مع كلمة “Coefs”‏ کصف ‘J‏ 
Ul‏ بقية الصفوف فتم تعبئتها بمعاملات b‏ والتي تم تحويلها من أرقام حقيقية 
إلى حروفء أما استخدام الشرطة الخلفية 7“ فإنها تدمج الصفوف A‏ 
مصفوفة مثلما تفعل الفاصلة ”,“ التي تقوم بدمج الأعمدة. التحويل من أرقام 
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إلى حروف لقيم b‏ مهم لجعل أنواع المصفوفات متوافقةء وهناك عمليات 
ممثلة في 0152 من الأعمدة الموصوفة للأخطاء المعيارية وإحصائيات t‏ 
والاحتمالات. 





*! 2 
*! L. Hamilton, Statistics with Stata (2012) 
program ols2 
version 12.1 
syntax varlist(min-1 numeric) [in] [if] 
marksample touse 
gen cons = 1 
tokenize ‘varlist' 
local lhs "^1'" 
mac shift 
local rhs "^*'" 
mata: st view(yz., ., "'lhs'", "‘touse'") 


mata: st view(X-., oy (tokens(""rhs'"), 
"Cons "), "^touse'") 

mata: b = invsym(X'X)*X'y 

mata: e = y - X*b 

mata: n = rows(X) 

mata: k - cols(X) 

mata: s2 - (e'e)/(n-k) 

mata: V - s2*invsym(X'X) 

mata: se - sqrt(diagonal(V)) 

mata: t - b:/se 

mata: Prt = 2*ttail(n-k, abs(b:/se)) 

mata: vnames = "Yyar: “lhs'", 


tokens("*rhs'"), " cons" 
mata: vnames ', ("Coef." ١ strofreal(b)), /* 
*/ ("Std. Err." ١ strofreal(se)), /* 
27 (^t* \ strofreal(t)), ("P»|t|" \ 
strofreal (Prt) ) 
drop cons. 
end 


. ols2 decom capacity years 


1 2 3 4 5 


Yvar:, decom Coef. Std. Err. t P»]|tc| 
capacity .1758739 .0247774 7.098157 .0192756 


years 3.899314 .2643087 14.75288 -0045632 
—cons -11.39963 4.330311 -2.632521 -1190687 


e oU کم رم‎ 
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تمارين Mata‏ - مثلها مثل الأمثلة الأخرى في هذا الففصل - تعطي 
لمحة عن البرمجة في ستاتا. كما أن مجلة ستاتا Stata Journal‏ تقوم بنشر 
تطبيقات أكثر توسعاً. وكل تحد بث لبرنامج ستاتا يتضمن ملفات ado-files‏ 
جديدة ومطورة؛ كما Online NetCourses d‏ تعرض lá jb‏ إرشادية لتعليمك 
كيف تكتب برامجك الخاصة بك. 


مصادر البيانات 


Dataset Sources 





المنشورات أو صفحات الإنترنت أدناه» تعرض بعض المعلومات. وهذه 
المعلومات مثل: التعريفات» والمصادر الأصلية للبيانات» وعرض أوسع عن 
البيانات التي تم استخدامها في أمثلة هذا الكتاب. في allel)‏ فإن بيانات 
الأمثلة هي مقتطفات من ملفات أكبرء أو تحتوي على متغيرات تم دمجها من 

أكثر من مصدر واحد. انظر قائمة المراجع للحصول على قائمة كاملة بها. 
aids.raw‏ 


aids.dta 
Selvin (1995) 


Alaska places.dta 
Hamilton et al. (2011) 


Alaska regions.dta 
Hamilton and Lammers (2011) 


Antarctic2.dta 
Milke and Heygster (2009) 


Arctic9. dta 
Sea ice extent: NSIDC (National Snow and Ice Data Center), Sea Ice Index. 
http://nsidc.org/data/seaice_index/ 
Sea ice volume: PIOMAS Gur Arctic Ice Ocean Modeling and Assimilation 


System), 

Polar Science Center, University of Washington. Arctic Sea Ice Volume 

Anomaly. 

mp ://psc.apl.washington.edu/wordpress/research/projects/arctic-sea-ice- 
olume-ano 


maly/ 
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Annual air temperature anomaly 64-90 ?N: GISTEMP (GISS Surface 
Temperature 


Analysis), Goddard Institute for Space Studi e s , NASA. 
http://data.giss.nasa.gov/gistemp/ 


attract2.dta 
Hamilton (2003) 


Canadal.dta 
Canada2.dta 


Federal, Provincial and Territorial Advisory Committee on Population Health 
(1996) 


Climate.dta 


NCDC global temperature: National Climatic Data Center, NOAA. Global 
Surface 


Temperature Anomalies. http://www.ncdc.noaa.gov/cmb-faq/anomalies.php 


NASA global temperature: GISTEMP (GISS Surface Temperature Analysis), 
Goddard 


Institute for Space Studies, NASA. http://data.giss.nasa.gov/gistemp/ 
UAH global temperature: Universicy of Alabama, Huntsville. 
http://vortex.nsstc.uah.edu/data/msu/t2It/uahnedc. It 


Aerosol Optical Depth (AOD): Sato et al. (1993). Goddard Institute for Space 
Studies, ` 


NASA. Forcings in GISS Climate Model. 
http://data.giss.nasa.gov/modelforce/strataer/ 


Total Solar Irradiance (TSI): Fröhlich (2006). Physikalisch-Meteorologischen 


Observatoriums Davos, World Radiation Center (PMOD WRC). Solar 
Constant. 


http://www. pmodwrc.ch/pmod.php?topic=tsi/composite/SolarConstant 


Multivariate ENSO Index (MEI): Wolter and Timlin (1998). Earth Systems 
Research 


Laboratory, Physical Sciences Division, NOAA. Multivariate ENSO Index. 
http://www.esrl.noaa.gov/psd/enso/mei/mei.html 


Global average marine surface CO2: Masarie and Tans (1995). Earth System 
Research 


Cee Global Monitoring Division, NOAA. Trends in Atmospheric 
arbon , 


Dioxide. http://www.esrl.noaa.gov/gmd/ccgg/trends/global.html#global_data 
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election 2004i.dta 
Robinson (2005). Geovisualization of the 2004 Presidential Election. 


http://www.personal.psu.edu/users/a/c/acr18]/election.html 


electricity.dta 


California Energy Commission (2012). U.S. Per Capita Electricity Use by 
State, 2010. 


http://energyalmanac.ca.gov/electricity/us per capita electricity-2010.html 


globall.dta 
global2.dta 
global3.dta 
global yearly.dta 
Multivariate ENSO Index (MET): see climate.dta 


NCDC global temperature: see c/imate.dta 


Granite2011 6.dta 


Hamilton (2012). Also see "Do you believe the climate is changing?" by 
Hamilton (2011) 


athttp://www.carseyinstitute.unh.edu/publications/IB-Hamilton-Climate- 
Change-National- - 


NH.pdf 


Greenland sulfate.dta 


Mayewski, Holdsworth et al. (1993); Mayewski, Meeker et al. (1993). Also see 
Sulfate and 


Nitrate Concentrations at GISP2 from 1750-1990. 
http://www.gisp2.sr.unh.edu/DATA/SO4NO3.htmi 


Greenland temperature.dta 


GISP2 ice core temperature: Alley (2004). NOAA Paleoclimatology Program 
and World : 


Data Center for Paleoclimatology, Boulder. 


ftp://ftp.ncdc.noaa.gov/pub/data/paleo/icecore/greenland/summit/gisp2/isotope 
s/gisp2_temp 


_accum_alley2000.txt 
Summit temperature 1987-1999: Shuman et al. (2001) 


greenpop!.dta 


Hamilton and Rasumssen (2010) 
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GSS 2010 SwS.dta 


Davis et al. (2005). National Opinion Research Center (NORC), University of 
Chicago. 


General Social Survey. http://www3.norc.org/GSS+Website/ 


heart.dta 
Selvin (1995) 


lakewinl.dta 
lakewin2.dta 
lakewin3.dta 
lakesun.dta 
lakesunwin.dta 


Lake Winnipesaukee ice out: 
http://www. winnipesaukee.com/index.php?pageid=iceout 


Lake Sunapee ice out: 
http://www.town.sunapee.nh.us/Pages/SunapeeNH_Clerk/ 


Also see Hamilton et al. (2010a) at 
http://www carseyinstitute.unh.edu/publications/IB_Hamilton_Climate_Survey 
—NH.p 
MEIO.dta 
MEI!.dta 
Multivariate ENSO Index: see c/imate.dta 


MiLwater.dta 
Hamilton (1985) 


Nations2.dta 
Nations3.dta 


Human Development Reports, United Nations Development Program. 
International Human 


Development Indicators. http://hdrstats.undp.org/en/tables/ 


oakridge.dta 
Selvin (1995) 


planets.dta 
Beatty (1981) 
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PNWsurvey2 11.dta 


Hamilton et al. (2010b, 2012). Also see “Ocean views" by Safford and Hamilton 
(2010), 


at http://www.carseyinstitute.unh.edu/publications/PB Safford DowneastMaine.pdf 


reactor.dta 
Brown et al. (1986) 


shuttle.dta 
shuttle0.dta 


Report of the Presidential Commission on the Space Shuttle Challenger 
Accident (1986) 


Tufte (1997) 


smokingl.dta 
smokingl.dta 
Rosner (1995) 


snowfall.xls 
Hamilton et al. (2003) 


southmig.dta 
southmig2.dta 
Voss et al. (2005) 


student2.dta 
Ward and Ault (1990) 


whitemtl.dta 
whitemt2.dta 
Hamilton et al. (2007) 


_writing. dta 
Nash and Schwartz (1987) 
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